Crédit :CC0 Domaine Public
En 1996, quand un ordinateur a gagné un match contre le champion du monde d'échecs en titre Garry Kasparov, ce n'était rien de moins qu'une sensation. Après cette percée dans le monde des échecs, le jeu de plateau Go a longtemps été considéré comme un bastion réservé aux joueurs humains en raison de sa complexité. Mais les meilleurs joueurs du monde ne peuvent rivaliser avec le logiciel AlphaGo. La recette du succès de ce programme informatique est rendue possible grâce à une combinaison de ce que l'on appelle Monte Carlo Tree Search et de réseaux de neurones profonds basés sur l'apprentissage automatique et l'intelligence artificielle. Une équipe de chercheurs de l'Université de Münster en Allemagne vient de démontrer que cette combinaison est extrêmement bien adaptée à la planification de synthèses chimiques - dites rétrosynthèses - avec une efficacité sans précédent. L'étude a été publiée dans le numéro actuel de La nature .
Marwin Segler, l'auteur principal de l'étude, dit, "La rétrosynthèse est la discipline ultime de la chimie organique. Les chimistes ont besoin d'années pour la maîtriser, tout comme aux échecs ou au Go. En plus d'une expertise simple, il faut aussi une bonne part d'intuition et de créativité pour cela. Jusque là, tout le monde supposait que les ordinateurs ne pourraient pas suivre sans des experts qui programment à la main des dizaines de milliers de règles. Ce que nous avons montré, c'est que la machine peut, par lui-même, apprendre les règles et leurs applications à partir de la littérature disponible."
La rétrosynthèse est la méthode standard pour concevoir la production de composés chimiques. Revenir en arrière mentalement, le principe est que le composé est décomposé en composants de plus en plus petits jusqu'à l'obtention des composants de base. Cette analyse fournit la recette, qui est ensuite utilisé pour travailler "en avant" en laboratoire pour produire la molécule cible, à partir des matières premières. Bien que facile en théorie, le processus présente des difficultés dans la pratique. "Comme aux échecs, à chaque pas ou mouvement, vous avez le choix entre plusieurs possibilités, " dit Segler. " En chimie, cependant, il y a des ordres de grandeur plus de coups possibles qu'aux échecs, et le problème est beaucoup plus complexe."
C'est là que la nouvelle méthode entre en jeu, relier les réseaux de neurones profonds à la recherche arborescente de Monte Carlo, une constellation si prometteuse qu'un grand nombre de chercheurs de diverses disciplines y travaillent. Le Monte Carlo Tree Search est une méthode d'évaluation des mouvements dans un jeu. A chaque mouvement, l'ordinateur simule de nombreuses variantes, par exemple, comment une partie d'échecs pourrait se terminer. Le coup le plus prometteur est ensuite sélectionné.
D'une manière similaire, l'ordinateur recherche maintenant les meilleurs "mouvements" possibles pour la synthèse chimique. Il est également capable d'apprendre en utilisant des réseaux de neurones profonds. À cette fin, l'ordinateur puise dans toute la littérature chimique jamais publiée, qui décrit près de 12 millions de réactions chimiques. Mike Preuss, spécialiste des systèmes d'information et co-auteur de l'étude, dit, "Les réseaux de neurones profonds sont utilisés pour prédire quelles réactions sont possibles avec une certaine molécule. En utilisant la recherche par arbre Monte Carlo, l'ordinateur peut tester si les réactions prédites mènent vraiment à la molécule cible. »
L'idée d'utiliser des ordinateurs pour planifier des synthèses n'est pas nouvelle. "L'idée date en fait d'environ 60 ans." dit Segler. "Les gens pensaient que ce serait suffisant, comme dans le cas des échecs, pour entrer un grand nombre de règles dans l'ordinateur. Mais cela n'a pas fonctionné. La chimie est très complexe, et contrairement aux échecs ou au Go, elle ne peut pas être appréhendée purement logiquement à l'aide de règles simples. A cela s'ajoute le fait que le nombre de publications avec de nouvelles réactions double tous les 10 ans environ. Ni les chimistes ni les programmeurs ne peuvent suivre cela. Nous avons besoin de l'aide d'un ordinateur intelligent. » La nouvelle méthode est environ 30 fois plus rapide que les programmes conventionnels de planification de synthèses et elle trouve des voies de synthèse potentielles pour deux fois plus de molécules.
Dans un test AB en double aveugle, les chercheurs de Muenster ont découvert que les chimistes considèrent ces voies de synthèse générées par ordinateur comme étant tout aussi bonnes que celles qui ont déjà fait leurs preuves. "Nous l'espérons, en utilisant notre méthode, les chimistes n'auront pas à essayer autant en laboratoire, " Segler ajoute, " et qu'en conséquence, et en utilisant moins de ressources, ils seront capables de produire les composés qui rendent possible notre niveau de vie élevé."