Une équipe de Stanford a développé un programme d'intelligence artificielle qui a recréé le tableau périodique des éléments; ils visent à exploiter cet outil pour découvrir et concevoir de nouveaux matériaux. Crédit :Claire Scully
Il a fallu près d'un siècle d'essais et d'erreurs aux scientifiques humains pour organiser le tableau périodique des éléments, sans doute l'une des plus grandes réalisations scientifiques en chimie, dans sa forme actuelle.
Un nouveau programme d'intelligence artificielle (IA) développé par des physiciens de Stanford a accompli le même exploit en quelques heures seulement.
Appelé Atom2Vec, le programme a réussi à faire la distinction entre différents atomes après avoir analysé une liste de noms de composés chimiques à partir d'une base de données en ligne. L'IA non supervisée a ensuite utilisé des concepts empruntés au domaine du traitement du langage naturel - en particulier, l'idée que les propriétés des mots peuvent être comprises en regardant d'autres mots qui les entourent - pour regrouper les éléments en fonction de leurs propriétés chimiques.
"Nous voulions savoir si une IA peut être assez intelligente pour découvrir le tableau périodique par elle-même, et notre équipe a montré qu'elle peut, " a déclaré le responsable de l'étude Shou-Cheng Zhang, le professeur de physique J. G. Jackson et C. J. Wood à la Stanford's School of Humanities and Sciences.
Zhang dit que la recherche, publié dans le numéro du 25 juin de Actes de l'Académie nationale des sciences , est un premier pas important vers son objectif plus ambitieux, qui conçoit un remplaçant au test de Turing - l'étalon-or actuel pour évaluer l'intelligence des machines.
Pour qu'une IA réussisse le test de Turing, il doit être capable de répondre aux questions écrites d'une manière indiscernable d'un humain. Mais Zhang pense que le test est défectueux car il est subjectif. "Les humains sont le produit de l'évolution et nos esprits sont encombrés de toutes sortes d'irrationalités. Pour qu'une IA réussisse le test de Turing, il faudrait reproduire toutes nos irrationalités humaines, " dit Zhang. " C'est très difficile à faire, et pas une utilisation particulièrement bonne du temps des programmeurs."
Zhang aimerait plutôt proposer une nouvelle référence de l'intelligence artificielle. "Nous voulons voir si nous pouvons concevoir une IA capable de battre les humains en découvrant une nouvelle loi de la nature, " dit-il. " Mais pour ce faire, nous devons d'abord tester si notre IA peut faire certaines des plus grandes découvertes déjà faites par les humains."
En recréant le tableau périodique des éléments, Atom2Vec a atteint cet objectif secondaire, dit Zhang.
Le potassium est roi comme…
Zhang et son groupe ont modélisé Atom2Vec sur un programme d'IA créé par les ingénieurs de Google pour analyser le langage naturel. Appelé Word2Vec, le langage AI fonctionne en convertissant les mots en codes numériques, ou vecteurs. En analysant les vecteurs, l'IA peut estimer la probabilité qu'un mot apparaisse dans un texte étant donné la cooccurrence d'autres mots.
Par exemple, le mot "roi" est souvent accompagné de "reine, " et " homme " par " femme ". Ainsi, le vecteur mathématique du "roi" pourrait être traduit grossièrement par "roi =une reine moins une femme plus un homme".
"Nous pouvons appliquer la même idée aux atomes, " dit Zhang. " Au lieu de se nourrir de tous les mots et phrases d'une collection de textes, nous avons nourri Atom2Vec de tous les composés chimiques connus, tels que NaCl, KCl, H20, etc."
A partir de ces données éparses, le programme d'IA compris, par exemple, que le potassium (K) et le sodium (Na) doivent avoir des propriétés similaires car les deux éléments peuvent se lier au chlore (Cl). "Tout comme le roi et la reine sont semblables, le potassium et le sodium sont similaires, " dit Zhang.
Zhang espère qu'à l'avenir, les scientifiques peuvent exploiter les connaissances d'Atom2Vec pour découvrir et concevoir de nouveaux matériaux. « Pour ce projet, le programme d'IA n'était pas supervisé, mais vous pourriez imaginer lui donner un but et lui demander de trouver, par exemple, un matériau très efficace pour convertir la lumière du soleil en énergie, " dit Zhang.
Son équipe travaille déjà sur la version 2.0 de leur programme d'IA, qui se concentrera sur la résolution d'un problème insoluble dans la recherche médicale :concevoir le bon anticorps pour attaquer les antigènes - des molécules capables d'induire une réponse immunitaire - qui sont spécifiques aux cellules cancéreuses. Actuellement, l'une des approches les plus prometteuses pour guérir le cancer est l'immunothérapie anticancéreuse, qui consiste à exploiter les anticorps qui peuvent attaquer les antigènes sur les cellules cancéreuses.
Mais le corps humain peut produire plus de 10 millions d'anticorps uniques, dont chacun est constitué d'une combinaison différente d'environ 50 gènes. "Si nous pouvons cartographier ces gènes de base sur un vecteur mathématique, alors nous pouvons organiser tous les anticorps dans quelque chose de similaire à un tableau périodique, " dit Zhang. " Alors, si vous découvrez qu'un anticorps est efficace contre un antigène mais qu'il est toxique, vous pouvez rechercher au sein de la même famille un autre anticorps tout aussi efficace mais moins toxique."