Measuring Biodiversity via Bayesian Nonparametrics: Estimation, Clustering and Uncertainty Quantification - Finanziamento dell’Unione Europea – NextGenerationEU – missione 4, componente 2, investimento 1.1.
Progetto Il primo stimatore per la probabilità di scoprire una specie precedentemente sconosciuta fu elaborato da Alan Turing, mentre cercava di decifrare la macchina tedesca Enigma durante la Seconda Guerra Mondiale. Le generalizzazioni dello stimatore di Turing rispondono al "problema delle specie non viste", che riguarda la stima del numero di specie rappresentate in un ecosistema che non sono state osservate nei dati disponibili. Il problema delle specie non viste rappresenta solo un aspetto, seppur fondamentale, della quantificazione della biodiversità, che comprende anche la stima delle dimensioni della popolazione, la stima delle proporzioni delle specie e delle specie rare, solo per citarne alcune. Questa ampia classe di problemi statistici che coinvolgono popolazioni di individui appartenenti a specie diverse con proporzioni sconosciute è nota come problemi di campionamento delle specie. L'interesse per questa classe di problemi è cresciuto notevolmente negli ultimi anni, grazie al ruolo che essi rivestono nello studio della diversità genomica, un altro aspetto della biodiversità, e a una serie di questioni correlate in diversi campi scientifici.
Tra i vari paradigmi statistici, l'approccio nonparametrico Bayesiano si distingue come ideale per affrontare i problemi di campionamento delle specie e porta alla stima di principio, al raggruppamento basato su modelli e alla quantificazione dell'incertezza. Conta già su diversi successi nel caso scambiabile, cioè il caso di una singola popolazione omogenea. L'omogeneità è spesso restrittiva in presenza di ecosistemi diversi ma interagenti, motivando il nostro obiettivo di andare oltre e affrontare la situazione di più popolazioni eterogenee. In primo luogo introduciamo e studiamo un'adeguata classe di modelli probabilistici, da definire modelli di campionamento multivariato delle specie, e poi affrontiamo diversi problemi di campionamento multivariato delle specie, che sono in gran parte aperti e inesplorati. Le nuove direzioni di ricerca più impegnative includono il problema delle specie non viste multivariate, il raggruppamento e l'evoluzione temporale delle comunità di specie e la classificazione tassonomica.