Capture d'écran de d-cell.ucsd.edu, où les chercheurs peuvent utiliser DCell, une nouvelle cellule de levure virtuelle développée à la faculté de médecine de l'UC San Diego. Crédit:UC San Diego Health
Les chercheurs de l'UC San Diego School of Medicine ont développé un réseau neuronal visible et l'ont utilisé pour construire DCell, un modèle virtuel d'une cellule de levure de bière fonctionnelle.
"Il semble que chaque fois que vous vous retournez, quelqu'un parle de l'importance de l'intelligence artificielle et de l'apprentissage automatique, " dit Trey Ideker, Doctorat, Professeur à la faculté de médecine de l'Université de Californie à San Diego et au Moores Cancer Center. « Mais tous ces systèmes sont des « boîtes noires ». Ils peuvent être très prédictifs, mais nous ne savons pas grand-chose sur leur fonctionnement."
Ideker donne un exemple :les systèmes d'apprentissage automatique peuvent analyser les comportements en ligne de millions de personnes pour signaler un individu comme un « terroriste » potentiel ou un « risque de suicide ». "Pourtant, nous n'avons aucune idée de comment la machine est parvenue à cette conclusion, " il a dit.
Pour que l'apprentissage automatique soit utile et digne de confiance dans les soins de santé, Ideker a dit, les praticiens doivent ouvrir la boîte noire et comprendre comment un système parvient à une décision.
Les systèmes d'apprentissage automatique sont construits sur des couches de neurones artificiels, connu sous le nom de réseau de neurones. Les couches sont liées entre elles par des connexions apparemment aléatoires entre les neurones. Les systèmes « apprennent » en ajustant ces connexions.
L'équipe de recherche d'Ideker a récemment développé ce qu'elle appelle un réseau de neurones « visible » et l'a utilisé pour construire DCell, un modèle de cellule de levure de bière fonctionnelle, couramment utilisé comme modèle en recherche fondamentale. Pour faire ça, ils ont rassemblé toutes les connaissances de la biologie cellulaire en un seul endroit et ont créé une hiérarchie de ces composants cellulaires. Ensuite, ils ont mappé des algorithmes d'apprentissage automatique standard sur cette base de connaissances.
DCell peut être consulté sur d-cell.ucsd.edu. Les détails techniques sont publiés le 5 mars dans Méthodes naturelles .
Mais ce qui excite le plus Ideker, c'est que DCell n'est pas une boîte noire; les connexions ne sont pas un mystère et ne peuvent pas se former par hasard. Au lieu, « l'apprentissage » n'est guidé que par des comportements et des contraintes cellulaires du monde réel codés à partir d'environ 2, 500 composants cellulaires connus. L'équipe saisit des informations sur les gènes et les mutations génétiques et DCell prédit les comportements cellulaires, comme la croissance. Ils ont formé DCell sur plusieurs millions de génotypes et ont découvert que la cellule virtuelle pouvait simuler la croissance cellulaire presque aussi précisément qu'une cellule réelle cultivée en laboratoire.
"La connaissance humaine est incomplète, " dit Jianzhu Ma, Doctorat, un chercheur scientifique adjoint dans le laboratoire d'Ideker qui a dirigé les efforts pour construire DCell. "Nous voulons compléter ces connaissances pour aider à guider les prédictions, dans les soins de santé et ailleurs.
Ideker et Ma ont également mis DCell à l'épreuve. S'ils ont délibérément fourni au système de fausses informations, ça ne marcherait pas. Prenez des ribosomes, par exemple. Les cellules utilisent ces minuscules machines biologiques pour traduire l'information génétique en protéines. Mais si les chercheurs ont plutôt relié les ribosomes à un processus sans rapport comme l'apoptose, un système que les cellules utilisent pour se suicider, DCell ne pouvait plus prédire la croissance cellulaire. La cellule virtuelle « sait » que le nouvel arrangement n'est pas biologiquement possible.
Ideker et ses collègues de la Cancer Cell Map Initiative, qu'il co-dirige, génèrent maintenant certaines des données expérimentales dont ils ont besoin pour construire une DCell pour le cancer humain. Ensuite, ils détermineront la meilleure façon de personnaliser cette approche de cellule virtuelle pour la biologie unique d'un patient.
"Nous voulons un jour être en mesure de saisir vos mutations génétiques spécifiques liées au cancer et obtenir une lecture sur l'agressivité de votre cancer, et la meilleure approche thérapeutique pour prévenir sa croissance et ses métastases, " dit Ideker, qui est également fondateur du Centre de biologie computationnelle et de bioinformatique de l'UC San Diego.