Crédit :енис Марчук de Pixabay
Les chercheurs ont conçu un algorithme d'apprentissage automatique qui prédit le résultat des réactions chimiques avec une précision beaucoup plus élevée que les chimistes qualifiés et suggère des moyens de fabriquer des molécules complexes, éliminer un obstacle important à la découverte de médicaments.
Des chercheurs de l'Université de Cambridge ont montré qu'un algorithme peut prédire les résultats de réactions chimiques complexes avec une précision de plus de 90 %, surpassant les chimistes qualifiés. L'algorithme montre également aux chimistes comment fabriquer des composés cibles, fournir la "carte" chimique jusqu'à la destination souhaitée. Les résultats sont rapportés dans deux études dans les revues ACS Science centrale et Communications chimiques .
Un défi central dans la découverte de médicaments et la science des matériaux est de trouver des moyens de fabriquer des molécules organiques complexes en réunissant chimiquement des blocs de construction plus simples. Le problème est que ces blocs de construction réagissent souvent de manière inattendue.
"La fabrication de molécules est souvent décrite comme un art réalisé avec des expérimentations par essais et erreurs car notre compréhension de la réactivité chimique est loin d'être complète, " a déclaré le Dr Alpha Lee du laboratoire Cavendish de Cambridge, qui dirigeait les études. "Les algorithmes d'apprentissage automatique peuvent avoir une meilleure compréhension de la chimie car ils distillent des modèles de réactivité à partir de millions de réactions chimiques publiées, quelque chose qu'un chimiste ne peut pas faire."
L'algorithme développé par Lee et son groupe utilise des outils de reconnaissance de formes pour reconnaître comment les groupes chimiques dans les molécules réagissent, en entraînant le modèle sur des millions de réactions publiées dans des brevets.
Les chercheurs ont considéré la prédiction des réactions chimiques comme un problème de traduction automatique. Les molécules réagissantes sont considérées comme un seul langage, tandis que le produit est considéré comme une langue différente. Le modèle utilise ensuite les modèles du texte pour apprendre à traduire entre les deux langues.
En utilisant cette approche, le modèle atteint une précision de 90 % dans la prédiction du produit correct de réactions chimiques invisibles, alors que la précision des chimistes humains formés est d'environ 80%. Les chercheurs disent que le modèle est suffisamment précis pour détecter les erreurs dans les données et prédire correctement une pléthore de réactions difficiles.
Le modèle sait aussi ce qu'il ne sait pas. Il produit un score d'incertitude, qui élimine les prédictions incorrectes avec une précision de 89 %. Comme les expériences prennent du temps, une prédiction précise est cruciale pour éviter de poursuivre des voies expérimentales coûteuses qui finissent par se solder par un échec.
Dans la deuxième étude, Lee et son groupe, collaboration avec la société biopharmaceutique Pfizer, démontré le potentiel pratique de la méthode dans la découverte de médicaments.
Les chercheurs ont montré que lorsqu'ils étaient formés à la recherche publiée en chimie, le modèle peut faire des prédictions précises des réactions basées sur des cahiers de laboratoire, montrant que le modèle a appris les règles de la chimie et peut les appliquer aux paramètres de découverte de médicaments.
L'équipe a également montré que le modèle peut prédire des séquences de réactions qui conduiraient à un produit souhaité. Ils ont appliqué cette méthodologie à diverses molécules de type médicament, montrant que les étapes qu'il prédit sont chimiquement raisonnables. Cette technologie peut réduire considérablement le temps de découverte de médicaments précliniques, car elle fournit aux chimistes médicinaux un modèle d'où commencer.
"Notre plateforme est comme un GPS pour la chimie, " dit Lee, qui est également chercheur au St Catharine's College. "Il informe les chimistes si une réaction est un "go" ou "no-go", et comment naviguer sur les voies de réaction pour fabriquer une nouvelle molécule. »
Les chercheurs de Cambridge utilisent actuellement cette technologie de prédiction de réaction pour développer une plate-forme complète qui relie le cycle conception-fabrication-test dans la découverte de médicaments et la découverte de matériaux :prédire des molécules bioactives prometteuses, des moyens de fabriquer ces molécules organiques complexes, et sélectionner les expériences les plus informatives. Les chercheurs travaillent maintenant à extraire des informations chimiques du modèle, essayer de comprendre ce qu'il a appris que les humains n'ont pas.
"Nous pouvons potentiellement faire beaucoup de progrès en chimie si nous apprenons quels types de modèles le modèle examine pour faire une prédiction, " dit Pierre Bolgar, un doctorat étudiant en chimie organique de synthèse impliqué dans les deux études. "Le modèle et les chimistes humains ensemble deviendraient extrêmement puissants dans la conception d'expériences, plus que chacun ne le serait sans l'autre."