• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Chimie
    Une approche d'apprentissage automatique pourrait aider à la conception de processus industriels pour la fabrication de médicaments

    Un nouveau système informatique prédit les produits des réactions chimiques. « La vision est que vous serez capable de vous diriger vers un système et de dire :« Je veux fabriquer cette molécule. » Le logiciel vous indiquera la route à partir de laquelle vous devez la faire, et la machine le fera, », explique le professeur Klays Jensen. Crédit :Nouvelles du MIT

    Lorsque les chimistes organiques identifient un composé chimique utile, un nouveau médicament, par exemple, c'est aux ingénieurs chimistes de déterminer comment le produire en masse.

    Il pourrait y avoir 100 séquences différentes de réactions qui donnent le même produit final. Mais certains d'entre eux utilisent des réactifs moins chers et des températures plus basses que d'autres, et peut-être le plus important, certains sont beaucoup plus faciles à exécuter en continu, avec des techniciens remplissant occasionnellement des réactifs dans différentes chambres de réaction.

    Historiquement, déterminer le moyen le plus efficace et le plus rentable de produire une molécule donnée relève autant de l'art que de la science. Mais les chercheurs du MIT essaient de mettre ce processus sur une base empirique plus sûre, avec un système informatique formé sur des milliers d'exemples de réactions expérimentales et qui apprend à prédire quels seront les principaux produits d'une réaction.

    Les travaux des chercheurs sont publiés dans le journal de l'American Chemical Society ACS Science centrale . Comme tous les systèmes d'apprentissage automatique, le leur présente ses résultats en termes de probabilités. Dans les essais, le système était capable de prédire le produit principal d'une réaction 72 % du temps ; 87 pour cent du temps, il a classé le produit principal parmi ses trois résultats les plus probables.

    "Il y a clairement beaucoup compris sur les réactions aujourd'hui, " dit Klavs Jensen, le professeur Warren K. Lewis de génie chimique au MIT et l'un des quatre auteurs principaux de l'article, "mais c'est un très évolué, acquis des compétences pour regarder une molécule et décider comment vous allez la synthétiser à partir de matériaux de départ."

    Avec le nouveau travail, Jensen dit, "la vision est que vous serez capable de marcher jusqu'à un système et de dire, « Je veux fabriquer cette molécule. » Le logiciel vous indiquera l'itinéraire à partir duquel vous devez le faire, et la machine le fera."

    Avec 72 % de chances d'identifier le produit principal d'une réaction, le système n'est pas encore prêt à ancrer le type de synthèse chimique entièrement automatisée qu'envisage Jensen. Mais cela pourrait aider les ingénieurs chimistes à converger plus rapidement vers la meilleure séquence de réactions et peut-être suggérer des séquences qu'ils n'auraient peut-être pas étudiées autrement.

    Jensen est rejoint sur le papier par le premier auteur Connor Coley, un étudiant diplômé en génie chimique; Guillaume Vert, le professeur Hoyt C. Hottel de génie chimique, qui, avec Jensen, co-conseille Coley; Régina Barzilay, le professeur Delta Electronics de génie électrique et d'informatique; et Tommi Jaakkola, le professeur Thomas Siebel de génie électrique et d'informatique.

    Agir localement

    Une seule molécule organique peut être constituée de dizaines voire de centaines d'atomes. Mais une réaction entre deux de ces molécules peut n'impliquer que deux ou trois atomes, qui brisent leurs liaisons chimiques existantes et en forment de nouvelles. Des milliers de réactions entre des centaines de réactifs différents se résument souvent à un seul, réaction partagée entre la même paire de "sites de réaction".

    Une grosse molécule organique, cependant, peut avoir plusieurs sites de réaction, et quand il rencontre une autre grosse molécule organique, une seule des nombreuses réactions possibles entre eux aura réellement lieu. C'est ce qui rend la prédiction automatique des réactions si délicate.

    Autrefois, les chimistes ont construit des modèles informatiques qui caractérisent les réactions en termes d'interactions sur les sites de réaction. Mais elles nécessitent fréquemment l'énumération d'exceptions, qui doivent être recherchés indépendamment et codés à la main. Le modèle pourrait déclarer, par exemple, que si la molécule A a un site de réaction X, et la molécule B a un site de réaction Y, alors X et Y réagiront pour former le groupe Z, à moins que la molécule A ait également des sites de réaction P, Q, R, S, T, Toi, ou V.

    Il n'est pas rare qu'un seul modèle nécessite plus d'une douzaine d'exceptions énumérées. Et découvrir ces exceptions dans la littérature scientifique et les ajouter aux modèles est une tâche laborieuse, ce qui a limité l'utilité des modèles.

    L'un des principaux objectifs du nouveau système des chercheurs du MIT est de contourner ce processus ardu. Coley et ses co-auteurs ont commencé avec 15, 000 réactions empiriquement observées signalées dans les dépôts de brevets américains. Cependant, parce que le système d'apprentissage automatique devait apprendre quelles réactions ne se produiraient pas, ainsi que ceux qui le feraient, les exemples de réactions réussies ne suffisaient pas.

    Exemples négatifs

    Donc pour chaque paire de molécules dans l'une des réactions listées, Coley a également généré une batterie de produits supplémentaires possibles, en fonction des sites de réaction des molécules. Il a ensuite nourri des descriptions de réactions, avec ses listes artificiellement élargies de produits possibles, à un système d'intelligence artificielle appelé réseau de neurones, qui a été chargé de classer les produits possibles par ordre de probabilité.

    De cette formation, le réseau a essentiellement appris une hiérarchie de réactions - quelles interactions sur quels sites de réaction ont tendance à prendre le pas sur quels autres - sans la laborieuse annotation humaine.

    D'autres caractéristiques d'une molécule peuvent affecter sa réactivité. Les atomes à un site de réaction donné peuvent, par exemple, avoir des distributions de charges différentes, en fonction des autres atomes qui les entourent. Et la forme physique d'une molécule peut rendre un site de réaction difficile d'accès. Le modèle des chercheurs du MIT comprend donc également des mesures numériques de ces deux caractéristiques.

    Selon Richard Robinson, chercheur en technologies chimiques au laboratoire pharmaceutique Novartis, le système des chercheurs du MIT « propose une approche différente de l'apprentissage automatique dans le domaine de la synthèse ciblée, qui à l'avenir pourrait transformer la pratique de la conception expérimentale en molécules ciblées. »

    "Actuellement, nous nous appuyons fortement sur notre propre formation rétrosynthétique, qui est aligné avec nos propres expériences personnelles et augmenté avec des moteurs de recherche de base de données de réaction, ", dit Robinson. "Cela nous sert bien, mais se traduit souvent par un taux d'échec important. Même les chimistes très expérimentés sont souvent surpris. Si vous deviez additionner tous les échecs de synthèse cumulés en tant qu'industrie, cela serait probablement lié à un investissement de temps et d'argent important. Et si nous pouvions améliorer notre taux de réussite ? »

    Les chercheurs du MIT, Robinson dit, " ont intelligemment démontré une nouvelle approche pour obtenir des performances de réaction prédictives plus élevées que les approches conventionnelles. En augmentant la littérature rapportée avec des exemples de réactions négatives, l'ensemble de données a plus de valeur."

    Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.




    © Science https://fr.scienceaq.com