Screening del carcinoma mammario mediante metabolomica urinaria, profilamento ormonale, Machine Learning
Progetto Introduzione - In Regione Piemonte, lo screening primario del carcinoma mammario viene efficacemente svolto mediante mammografia, con periodicità biennale, ma con cadenza annuale per le donne che manifestano fattori predisponenti e ulteriori approfondimenti previsti nei casi sospetti (https://www.regione.piemonte.it/web/temi/sanita/prevenzione/screening-tumore-della-mammella).
Il limite di questa strategia di prevenzione è dato dall’individuazione dei suddetti “fattori predisponenti”, che attualmente si fondano su osservazioni anamnestiche, epidemiologiche e di conformazione fisica, tutti indici a bassa prevalenza e scarsa specificità, che danno luogo ad un eccesso di mammografie cautelative, con disagio per le pazienti e spesa per la Sanità pubblica. Esiste pertanto il forte bisogno di individuare nuovi strumenti di screening a bassa invasività, che si inseriscano nel contesto della “medicina personalizzata”, capaci di individuare le donne per quali l’intensificazione dei controlli preventivi sia effettivamente utile. La raccolta del campione urinario su cui svolgere le analisi di profilamento potrebbe eseguirsi nell’ambito della visita di controllo mammografico, senza disagio per le pazienti.
Obiettivi - Obiettivo finale del progetto è l'individuazione di un numero limitato di biomarcatori presenti nella matrice urinaria, che possano essere determinati quantitativamente mediante una metodica chimico-analitica a costo limitato e i cui risultati possano essere immediatamente interpretati mediante uno o più algoritmi di Machine Learning, tali da fornire un efficace strumento previsionale di screening per il tumore della mammella, ad elevata sensibilità e specificità.
Metodi – (1) Esecuzione di sperimentazione volta al miglioramento delle tecniche analitiche attualmente disponibili per la determinazione quantitativa di un ampio spettro di steroidi androgeni, estrogeni e loro coniugati mediante tecniche di spettrometria di massa (UHPLC-MS/HRMS). (2) Raccolta di campioni urinari da una popolazione campionaria statisticamente ampia e omogenea per fascia di età, sia di pazienti in prima visita all’ambulatorio IRCCS di Candiolo, sia di donne sottoposte a mammografia preventiva. (3) Analisi UHPLC-MS/HRMS di tali campioni secondo le succitate tecniche “targeted” e “untargeted”. (4) Messa a punto di strategie di analisi “untargeted” per lo studio della metabolomica di campioni urinari nella finalità di diagnosticare il carcinoma mammario in fase estremamente precoce e di individuarne i più efficaci biomarcatori anche in chiave di predisposizione. (5) Applicazione di strategie di pretrattamento dei “big data” originati dalle suddette analisi (soprattutto nelle analisi “untargeted”) al fine di estrarne il contenuto informativo. Applicazione ai dati e confronto di numerose tecniche di Machine Learning al fine di conseguire la migliore discriminazione fra le donne affette e non-affette da carcinoma mammario e di individuarne i fattori biochimici predisponenti (ad esempio, metodiche di Partial Least Squares Discriminant Analysis, Support Vector Machines, Random Forest, Gaussian Bayesian Network, Logistic Regression, XGBoost. (6) Confronto dei parametri di sensibilità e specificità, per ciascuno degli obiettivi posti, ottenuti dai diversi algoritmi e modelli statistici. Verifica degli stessi su popolazioni campionarie distinte e indipendenti.
Valutazione - Indicatori di valutazione del successo dell'iniziativa sono: (a) numero e diversità dei biomarcatori utili ad ottenere adeguati livelli di discriminazione fra le pazienti sane e quelle affette da carcinoma mammario in fase iniziale o predisposte a sviluppare tale patologia; (b) sensibilità e specificità determinate tramite curve ROC; (c) costo stimato delle analisi di screening entro un contesto di applicazione routinaria; (d) costo/risparmio complessivo dell'introduzione routinaria del n