Exploiting Deep Generative Models for Deciphering Somatic Mutation Patterns in Cancer and Predicting Drug sensitivity
Progetto Il cancro, caratterizzato dalla crescita incontrollata e dalla diffusione di cellule anomale all'interno dell'organismo, continua a rappresentare una grande sfida per la salute globale. Nonostante i progressi scientifici nella comprensione della biologia del cancro, questa malattia rimane responsabile di milioni di morti ogni anno. Lo sviluppo del cancro è un processo dinamico, influenzato da diversi fattori genetici e ambientali come l'esposizione ad agenti cancerogeni, errori nella replicazione del DNA e difetti nei meccanismi di riparazione del DNA. Questi processi portano all'accumulo di mutazioni somatiche nelle cellule non germinali.
Alla luce dei progressi tecnologici e della crescente quantità di dati genomici disponibili, l'intelligenza artificiale è diventata uno strumento essenziale, che ha permesso di rivelare dinamiche e meccanismi nuovi all'interno dei dati, riuscendo ad estrapolare relazioni complesse altrimenti difficili da modellizzare.
IPOTESI
La nostra ipotesi è che sfruttando tecniche avanzate di apprendimento automatico, in particolare i cosiddetti modelli generativi, si possa migliorare significativamente la nostra comprensione dei meccanismi generativi alla base del cancro.
In particolare, riteniamo che uno studio dettagliato delle mutazioni somatiche ad alto livello (analizzando le firme mutazionali) sia a livello più fine (studiando i profili delle singole mutazioni somatiche) possa fornire preziose indicazioni sullo sviluppo della malattie e sulle complesse relazioni che l’hanno generata.
OBBIETTIVI
Gli obiettivi del progetto sono:
• Sviluppare un metodo spiegabile basato su autoencoder generativii per l'estrazione di firme mutazionali da genomi tumorali. Grazie a una nuova architettura ibrida, composta da un encoder non lineare e da un decoder lineare, il modello terrà conto delle possibili interazioni non lineari tra i processi mutazionali senza compromettere l'interpretabilità. Crediamo fermamente che l'inclusione di interazioni non lineari possa portare alla scoperta di nuove firme mutazionali.
• Implementazione di un modello generativo per analizzare le regioni del DNA codificanti e non codificanti, considerando diversi eventi mutazionali e la specifica coordinata genomica della mutazione per ottenere un quadro completo e piu fine dei processi mutazionali.
• Integrazione dei due modelli per ricavare una rappresentazione compatta ma perspicace di ogni singolo genoma canceroso. Questa nuova rappresentazione sarà utilizzata da un modello finale di apprendimento automatico per prevedere i valori IC-50 di diversi farmaci.
•
Experimental design
Il disegno sperimentale prevede le seguenti fasi:
• Raccolta dati
• Pre Elaborazione dei dati
• Implementazione dei modelli
• Valutazione dei modelli
• Integrazione dei modelli
• Previsione della sensibilità ai farmaci
Risultati attesi
• L’Identificazione di modelli mutazionali e meccanismi precedentemente sconosciuti che guidano lo sviluppo e la progressione del cancro analizzando le firme mutazionali e le mutazioni somatiche sia nelle regioni codificanti che in quelle non codificanti. Questo sarà realizzato con una nuova pipeline basata su modelli generativi profondi, in grado di estrarre informazioni più utili rispetto ai metodi ad oggi disponibili.
• Lo sviluppo di un nuovo metodo di stratificazione dei pazienti e la creazione di profili unici dei pazienti consentiranno di migliorare la previsione della sensibilità ai farmaci, portando potenzialmente alla creazione di strategie di trattamento più mirate in grado di migliorare l’outcome dei pazienti.
Impatto sul cancro
Migliorare la comprensione delle mutazioni somatiche nel cancro, scoprendo modelli e meccanismi mutazionali precedentemente sconosciuti.
Ottenere una diagnosi e un trattamento del cancro più accurati e personalizzati, sviluppando strategie mi