L’uso di grandi modelli di intelligenza artificiale potrebbe aiutare i biologi a fare scoperte molto più rapidamente di prima.
Fornendo un modello di intelligenza artificiale (AI) – lo stesso tipo del famoso chatbot ChatGPT – con dati grezzi su milioni di cellule reali, la loro composizione chimica e genetica, i ricercatori dell’Università di Stanford hanno compiuto un’impresa tecnologica.
Hanno creato un programma in grado di identificare e classificare migliaia di tipi di cellule mai visti prima, durante la fase di apprendimento dell'IA.
Questo modello, chiamato UCE (for Universal Cell Embedding), è descritto in un articolo, non sottoposto a peer review, disponibile sulla piattaforma bioRxiv.
Tra queste migliaia di cellule sconosciute, l’UCE, ad esempio, ha individuato le cellule “Norn”. Si tratta di un raro sottoinsieme di cellule renali, principali produttrici dell'ormone EPO nel corpo umano, e la cui identità era sconosciuta fino allo scorso anno, dopo una pubblicazione su Nature Medicine.
“Ci sono voluti centotrentaquattro anni perché l’uomo scoprisse l’esistenza delle cellule Norn”, sottolinea il New York Times in un lungo articolo che inizia con il racconto di come il medico francese Francois Viault ebbe l’intuizione, nel 1889, dell'esistenza di tali cellule.
Con la loro intelligenza artificiale, i ricercatori hanno impiegato solo sei settimane. 'È tanto più straordinario in quanto nessuno aveva mai indicato al modello l'esistenza delle cellule Norn nei reni', sottolinea Jure Leskovec, informatico di Stanford responsabile dell'addestramento delle macchine.
Ha scoperto anche altri tipi di cellule sconosciute. Ma queste informazioni restano da verificare. L’UCE è solo un esempio tra gli altri di un grande modello di intelligenza artificiale, chiamato anche modello di fondazione, che sta adottando soprattutto il mondo della biologia.
“Con l'avvento di questi modelli, che dovrebbero disporre di un numero sempre maggiore di dati di laboratorio e di una maggiore potenza di calcolo, gli scienziati si aspettano di fare scoperte ancora più importanti”, assicura il New York Times.
Alcuni immaginano di svelare i misteri del cancro o di scoprire come trasformare un tipo di cellula in un altro.
Ma proprio come ChatGPT può commettere errori (prova a chiedere quante i ci sono nella parola pollo, per esempio), anche i modelli dei biologi possono commettere errori.
Alcuni sono quindi cauti. È il caso di Kasia Kedzierska, biologa computazionale dell’Università di Oxford, che sviluppa anche modelli di fondazione.
Ammette al quotidiano newyorkese di riporre molte speranze in questi modelli, ma aggiunge che, per il momento, “non dovrebbero essere utilizzati così come sono, finché non se ne identificano correttamente i limiti”.
Per migliorare il loro funzionamento, avremmo bisogno di ancora più dati scientifici. Ma sono necessariamente meno numerosi di quelli, provenienti da Internet, con cui si forma ChatGPT.
I progressi potrebbero essere più lenti di quanto si spera e comportano insidie da considerare, come i rischi per la privacy di coloro che possiedono le cellule o, peggio, la possibilità di sviluppare armi biologiche di nuovo genere.
Il New York Times aggiunge:
'Attraverso le loro prestazioni, i modelli di fondazione spingono i loro creatori a mettere in discussione il ruolo dei biologi in un mondo in cui i computer sono in grado di fare scoperte importanti senza l'aiuto di nessuno'.
'Questo ci costringerà a rivedere la nostra definizione di inventiva', ritiene Stephen Quake, biofisico di Stanford, che ha contribuito allo sviluppo dell'UCE. "Abbastanza da preoccupare seriamente i ricercatori!”