Comprendere ed analizzare le enormi quantità di dati provenienti dagli studi di genetica e genomica è molto complesso. Per questo si insiste nell’ampliare l’impiego di metodi computazionali come l’intelligenza artificiale e l’apprendimento automatico per un’analisi di dati più efficiente e rapida.
Cos’è l’intelligenza artificiale (IA)?
Esistono diverse definizioni di intelligenza artificiale. Una di queste definisce l’IA come “una scienza e un insieme di tecnologie computazionali che si ispirano, pur operando in modo molto diverso, ai modi in cui le persone usano i loro sistemi nervosi e i loro corpi per percepire, apprendere, ragionare e agire.”

L’IA può essere creata come software o strumenti in grado di mimare l’intelligenza umana in determinati contesti, o persino superarla in altri.
Cosa sono l’apprendimento automatico e il deep learning?
L’apprendimento automatico e il deep learning sono campi di studio frequentemente menzionati nel contesto dell’IA. L’apprendimento automatico è un processo mediante il quale le macchine possono acquisire la capacità di ricavare informazioni autonomamente su un insieme di dati, senza essere esplicitamente programmate su cosa imparare.
I computer possono generalmente apprendere in modo supervisionato o non supervisionato. Nell’apprendimento supervisionato, gli scienziati allenano i computer, fornendo loro una grande quantità di dati da studiare, e poi li sottopongono a test per verificarne la comprensione. I dati utilizzati per l’allenamento sono noti ed appartengono a categorie definite (ad esempio, persone con malattia coronarica e persone senza), che il computer può utilizzare per inferire ulteriori caratteristiche nascoste che distinguono le due categorie. È quindi poi in grado di utilizzare questa conoscenza per lavorare su dati sconosciuti e fare previsioni informate (ad esempio, quali persone in una popolazione sono predisposte a sviluppare malattie coronariche).
In un contesto di apprendimento non supervisionato, le macchine possono invece riconoscere modelli in grandi insiemi di dati e fare previsioni sul mondo reale senza bisogno di alcun allenamento precedente. Quando le macchine possono imparare in modo non supervisionato, sono considerate in grado di apprendere “profondamente”, e si parla di deep learning. Il deep learning è una tecnica relativamente moderna utilizzata per implementare l’apprendimento automatico. Un algoritmo di deep learning prende un insieme di dati ed elabora modelli e informazioni critiche imitando il modo in cui i neuroni del cervello umano interagiscono tra loro. Gli algoritmi sono reti neurali artificiali, un sistema informatico che simula la capacità del cervello di valutare l’importanza di alcuni dati rispetto ad altri e gestire i pregiudizi.
Perché c’è bisogno dell’intelligenza artificiale nel campo della genomica?
Sono trascorsi più di 20 anni dal primo completamento della sequenza del genoma umano. Questo traguardo ha portato alla generazione di una straordinaria quantità di dati. Le stime prevedono che la ricerca genomica genererà tra 2 e 40 exabyte di dati entro la prossima decade (guardate l’immagine sotto per vedere quanti zeri servono, stiamo parlando di miliardi di gigabytes).

Il sequenziamento del DNA e altre tecniche biologiche continueranno ad aumentare il numero e la complessità di tali insiemi di dati. Ecco perché i ricercatori hanno bisogno di strumenti computazionali basati su IA che possano gestire, estrarre e interpretare le preziose informazioni nascoste all’interno di questa grande quantità di dati.
In quali modi l’IA viene utilizzata in genomica?
Bisogna premettere che l’impiego di strumenti di IA in genomica è ancora in una fase iniziale, ma i ricercatori hanno già tratto beneficio dalla sviluppo di programmi che possono offrire assistenza specifica. Ecco alcuni esempi di attività che l’IA è in grado di svolgere:
- Esaminare i volti delle persone con programmi di analisi facciale per identificare disturbi genetici.
- Identificare il tipo primario di cancro da un biopsia liquida (un prelievo del sangue).
- Prevedere come un certo tipo di cancro progredirà in un paziente.
- Identificare varianti genomiche che causano malattie rispetto a varianti benigne.
- Migliorare la funzione degli strumenti di modifica dei geni, come CRISPR.
- Prevedere future variazioni nei genomi dei virus influenzali e SARS-CoV-2 per assistere negli sforzi di sanità pubblica.
- Un ultimo esempio molto “cool” è l’analisi della scansione della retina come strumento diagnostico per il rischio di malattie cardiovascolari. Siccome è possibile vedere i vasi sanguigni sulla parete interna dell’occhio, l’IA può essere allenata a riconoscere alterazioni invisibili ad occhio nudo tramite un’analisi della scansione della retina. Interpolando questa analisi con informazioni riguardanti pressione sanguigna, età e indice di massa corporea, è possibile stimare con accuratezza il rischio di sviluppare malattie cardiovascolari.
Fonti
https://www.genome.gov/about-genomics/educational-resources/fact-sheets/artificial-intelligence-machine-learning-and-genomics (testo e immagini)
