Crédit :CC0 Domaine public
Au cours des dernières années, les chercheurs se sont de plus en plus tournés vers les techniques de la science des données pour faciliter la résolution de problèmes en synthèse organique.
Des chercheurs du laboratoire d'Abigail Doyle, Professeur de chimie A. Barton Hepburn de Princeton, a collaboré avec le professeur d'informatique Ryan Adams pour développer un logiciel open source qui leur fournit un algorithme d'optimisation de pointe à utiliser dans le travail quotidien, intégrer ce qui a été appris dans le domaine de l'apprentissage automatique dans la chimie synthétique.
Le logiciel adapte les principes clés de l'optimisation bayésienne pour permettre des synthèses de produits chimiques plus rapides et plus efficaces.
D'après le théorème de Bayes, une formule mathématique pour déterminer la probabilité conditionnelle, L'optimisation bayésienne est une stratégie largement utilisée dans les sciences. Défini au sens large, il permet aux personnes et aux ordinateurs d'utiliser des connaissances antérieures pour informer et optimiser les décisions futures.
Les chimistes du labo de Doyle, en collaboration avec Adams, professeur d'informatique, et collègues de Bristol-Myers Squibb, comparé les capacités de prise de décision humaine avec le progiciel. Ils ont constaté que l'outil d'optimisation donne à la fois une plus grande efficacité par rapport aux participants humains et moins de biais sur une réaction de test. Leurs travaux sont publiés dans le numéro actuel de la revue La nature .
"L'optimisation des réactions est omniprésente en synthèse chimique, à la fois dans le milieu universitaire et dans l'ensemble de l'industrie chimique, " dit Doyle. " Puisque l'espace chimique est si grand, il est impossible pour les chimistes d'évaluer expérimentalement l'intégralité d'un espace réactionnel. Nous voulions développer et évaluer l'optimisation bayésienne en tant qu'outil pour la chimie synthétique compte tenu de son succès pour les problèmes d'optimisation connexes dans les sciences. »
Benjamin Boucliers, un ancien stagiaire postdoctoral au laboratoire Doyle et auteur principal de l'article, créé le package Python.
"Je viens d'une formation en chimie de synthèse, donc j'apprécie vraiment que les chimistes synthétiques soient assez bons pour résoudre ces problèmes par eux-mêmes, " a déclaré Shields. " Là où je pense que la vraie force de l'optimisation bayésienne entre en jeu, c'est qu'elle nous permet de modéliser ces problèmes de grande dimension et de capturer des tendances que nous ne pouvons peut-être pas voir dans les données nous-mêmes, il peut donc traiter les données beaucoup mieux.
"Et deux, dans un espace, il ne sera pas freiné par les préjugés d'un chimiste humain, " il ajouta.
Comment ça fonctionne
Le logiciel a commencé comme un projet hors champ pour répondre aux exigences de doctorat de Shields. Doyle et Shield ont ensuite formé une équipe sous le Centre de synthèse assistée par ordinateur (C-CAS), une initiative de la National Science Foundation lancée dans cinq universités pour transformer la façon dont la synthèse de molécules organiques complexes est planifiée et exécutée. Doyle est chercheur principal au C-CAS depuis 2019.
"L'optimisation de la réaction peut être un processus coûteux et chronophage, " dit Adams, qui est également le directeur du programme de statistiques et d'apprentissage automatique. "Cette approche l'accélère non seulement en utilisant des techniques de pointe, mais trouve également de meilleures solutions que celles que les humains identifieraient généralement. Je pense que ce n'est que le début de ce qui est possible avec l'optimisation bayésienne dans cet espace."
Les utilisateurs commencent par définir un espace de recherche - des expériences plausibles à considérer - comme une liste de catalyseurs, réactifs, ligands, solvants, températures, et concentration. Une fois que cet espace est préparé et que l'utilisateur définit le nombre d'expériences à exécuter, le logiciel choisit les conditions expérimentales initiales à évaluer. Ensuite, il suggère de nouvelles expériences à exécuter, itérer à travers un éventail de choix de plus en plus petit jusqu'à ce que la réaction soit optimisée.
« Lors de la conception du logiciel, J'ai essayé d'inclure des moyens pour que les gens injectent en quelque sorte ce qu'ils savent d'une réaction, " a déclaré Shields. " Peu importe comment vous utilisez cela ou l'apprentissage automatique en général, il y aura toujours un cas où l'expertise humaine est précieuse."
Le logiciel et des exemples d'utilisation sont accessibles dans ce référentiel. Des liens GitHub sont disponibles pour les éléments suivants :un logiciel qui représente les produits chimiques en cours d'évaluation dans un format lisible par machine via la théorie de la fonctionnelle de la densité ; logiciel d'optimisation de réaction; et le jeu qui recueille la prise de décision des chimistes sur l'optimisation de la réaction du test.
"L'optimisation de la réaction bayésienne comme outil de synthèse chimique, " par Benjamin J. Shields, Jason Stevens, juin Li, Marvin Parasram, Farhan Damani, Jésus I. Martinez Alvarado, Jacob M. Janey, Ryan P. Adams et Abigail G. Doyle, paraît dans le numéro du 3 février de la revue La nature .