Illustration conceptuelle d'une gouttelette contenant un réseau neuronal artificiel fait d'ADN qui a été conçu pour reconnaître des informations moléculaires complexes et bruyantes, représenté comme « écriture moléculaire ». Crédit :Olivier Wyart
Des chercheurs de Caltech ont développé un réseau de neurones artificiels à base d'ADN qui peut résoudre un problème classique d'apprentissage automatique :identifier correctement les nombres manuscrits. Le travail est une étape importante dans la démonstration de la capacité de programmer l'intelligence artificielle dans des circuits biomoléculaires synthétiques.
Le travail a été effectué dans le laboratoire de Lulu Qian, professeur assistant de bio-ingénierie. Un article décrivant la recherche paraît en ligne le 4 juillet et dans le numéro imprimé du 19 juillet de la revue La nature .
"Bien que les scientifiques aient tout juste commencé à explorer la création d'intelligence artificielle dans des machines moléculaires, son potentiel est déjà indéniable, " dit Qian. " De la même manière que les ordinateurs électroniques et les téléphones intelligents ont rendu les humains plus capables qu'il y a cent ans, les machines moléculaires artificielles pourraient faire toutes choses faites de molécules, peut-être même de la peinture et des bandages, plus capables et plus sensibles à l'environnement dans les cent ans à venir."
Les réseaux de neurones artificiels sont des modèles mathématiques inspirés du cerveau humain. Bien qu'ils soient très simplifiés par rapport à leurs homologues biologiques, les réseaux de neurones artificiels fonctionnent comme des réseaux de neurones et sont capables de traiter des informations complexes. Le but ultime du laboratoire Qian pour ce travail est de programmer des comportements intelligents (la capacité de calculer, faire des choix, et plus) avec des réseaux de neurones artificiels fabriqués à partir d'ADN.
"Les humains ont chacun plus de 80 milliards de neurones dans le cerveau, avec lesquels ils prennent des décisions très sophistiquées. Les petits animaux tels que les vers ronds peuvent prendre des décisions plus simples en utilisant seulement quelques centaines de neurones. Dans ce travail, nous avons conçu et créé des circuits biochimiques qui fonctionnent comme un petit réseau de neurones pour classer des informations moléculaires sensiblement plus complexes qu'auparavant, " dit Qian.
Pour illustrer la capacité des réseaux de neurones basés sur l'ADN, Kevin Cherry, étudiant diplômé du laboratoire Qian, a choisi une tâche qui est un défi classique pour les réseaux de neurones artificiels électroniques :reconnaître l'écriture manuscrite.
L'écriture humaine peut varier considérablement, et ainsi quand une personne scrute une séquence de nombres griffonnés, le cerveau effectue des tâches de calcul complexes afin de les identifier. Parce qu'il peut être difficile, même pour les humains, de reconnaître l'écriture bâclée des autres, L'identification des nombres manuscrits est un test courant pour programmer l'intelligence dans les réseaux de neurones artificiels. Il faut « apprendre » à ces réseaux à reconnaître les nombres, tenir compte des variations d'écriture, puis comparez un nombre inconnu à leurs soi-disant souvenirs et décidez de l'identité du nombre.
Dans le travail décrit dans le La nature papier, Cerise, qui est le premier auteur de l'article, a démontré qu'un réseau neuronal composé de séquences d'ADN soigneusement conçues pouvait effectuer des réactions chimiques prescrites pour identifier avec précision "l'écriture moléculaire". Contrairement à l'écriture visuelle qui varie en forme géométrique, chaque exemple d'écriture moléculaire ne prend pas réellement la forme d'un nombre. Au lieu, chaque numéro moléculaire est composé de 20 brins d'ADN uniques choisis parmi 100 molécules, chacun étant affecté pour représenter un pixel individuel dans n'importe quel motif 10 par 10. Ces brins d'ADN sont mélangés dans un tube à essai.
« Le manque de géométrie n'est pas rare dans les signatures moléculaires naturelles, mais nécessite toujours des réseaux neuronaux biologiques sophistiqués pour les identifier :par exemple, un mélange de molécules odorantes uniques comprend une odeur, " dit Qian.
Étant donné un exemple particulier d'écriture moléculaire, le réseau de neurones de l'ADN peut le classer dans jusqu'à neuf catégories, représentant chacun l'un des neuf chiffres manuscrits possibles de 1 à 9.
D'abord, Cherry a construit un réseau de neurones ADN pour faire la distinction entre les 6 et les 7 manuscrits. Il a testé 36 nombres manuscrits et le réseau de neurones du tube à essai les a tous correctement identifiés. Son système a théoriquement la capacité de classer plus de 12, 000 6s et 7s manuscrits—90 pour cent de ces nombres tirés d'une base de données de nombres manuscrits largement utilisés pour l'apprentissage automatique—dans les deux possibilités.
Le codage d'une stratégie concurrentielle « tout gagnant » utilisant des molécules d'ADN était crucial pour ce processus, développé par Qian et Cherry. Dans cette stratégie, un type particulier de molécule d'ADN surnommé l'annihilateur a été utilisé pour sélectionner un gagnant lors de la détermination de l'identité d'un nombre inconnu.
"L'annihilateur forme un complexe avec une molécule d'un concurrent et une molécule d'un concurrent différent et réagit pour former inerte, espèces non réactives, " dit Cherry. " L'annihilateur mange rapidement toutes les molécules concurrentes jusqu'à ce qu'il ne reste qu'une seule espèce concurrente. Le concurrent gagnant est alors ramené à une concentration élevée et produit un signal fluorescent indiquant la décision des réseaux."
Prochain, Cherry s'est appuyé sur les principes de son premier réseau de neurones ADN pour en développer un encore plus complexe, un qui pourrait classer les nombres à un chiffre de 1 à 9. Lorsqu'on lui donne un nombre inconnu, cette "soupe intelligente" subirait une série de réactions et produirait deux signaux fluorescents, par exemple, vert et jaune pour représenter un 5, ou vert et rouge pour représenter un 9.
Qian et Cherry prévoient de développer des réseaux de neurones artificiels capables d'apprendre, former des "souvenirs" à partir d'exemples ajoutés au tube à essai. Par ici, Qian dit, la même soupe intelligente peut être entraînée à effectuer différentes tâches.
« Les diagnostics médicaux courants détectent la présence de quelques biomolécules, par exemple le cholestérol ou la glycémie." dit Cherry. "En utilisant des circuits biomoléculaires plus sophistiqués comme le nôtre, les tests de diagnostic pourraient un jour inclure des centaines de biomolécules, avec l'analyse et la réponse conduites directement dans l'environnement moléculaire."
L'article s'intitule "Mise à l'échelle de la reconnaissance des formes moléculaires avec des réseaux de neurones gagnant-tout-en-un basés sur l'ADN".