Crédit :Frederik Sandfort/ Pixabay
La vie quotidienne sans intelligence artificielle est à peine concevable dans le monde d'aujourd'hui. D'innombrables applications dans des domaines tels que la conduite autonome, la traduction en langue étrangère ou les diagnostics médicaux ont trouvé leur place dans nos vies. Dans la recherche chimique, trop, de grands efforts sont déployés pour appliquer l'intelligence artificielle (IA), également connu sous le nom d'apprentissage automatique, effectivement. Ces technologies ont déjà été utilisées pour prédire les propriétés de molécules individuelles, permettant aux chercheurs de sélectionner plus facilement le composé à produire.
Cette fabrication, connu sous le nom de synthèse, implique généralement un effort considérable car il existe de nombreuses voies de synthèse possibles pour produire une molécule cible. Étant donné que le succès de chaque réaction individuelle dépend de nombreux paramètres, ce n'est pas toujours possible, même pour les chimistes expérimentés, pour prédire si une réaction aura lieu - et encore moins à quel point cela fonctionnera. Afin de remédier à cette situation, une équipe de chimistes et d'informaticiens de l'Université de Münster (Allemagne) s'est associée et a développé un outil d'IA qui vient d'être publié dans la revue Chimie .
Contexte et méthode :
« Une réaction chimique est un système très complexe, " explique Frederik Sandfort, doctorat étudiant à l'Institut de chimie organique et l'un des principaux auteurs de la publication. "Contrairement à la prédiction des propriétés de composés individuels, une réaction est l'interaction de plusieurs molécules et donc un problème multidimensionnel, " ajoute-t-il. De plus, il n'y a pas de "règles du jeu" clairement définies qui, comme dans le cas des ordinateurs d'échecs modernes, simplifier le développement de modèles d'IA. Pour cette raison, les approches précédentes pour prédire avec précision les résultats de réaction tels que les rendements ou les produits sont principalement basées sur une compréhension acquise précédemment des propriétés moléculaires. "Le développement de tels modèles demande beaucoup d'efforts. De plus, la majorité d'entre eux sont hautement spécialisés et ne peuvent être transférés à d'autres problèmes, " ajoute Frederik Sandfort.
Les travaux présentés se sont donc concentrés sur une applicabilité générale du programme, afin que d'autres chimistes puissent facilement l'utiliser pour leur propre travail. Pour s'en assurer, le modèle est basé directement sur les structures moléculaires. "Chaque composé organique peut être représenté sous forme de graphique, en principe comme une image, " explique Marius Kühnemund, un autre auteur, du domaine de l'informatique. "Sur de tels graphiques, des requêtes structurelles simples, comparables à la question des couleurs ou des formes d'une photo, peuvent être effectuées afin de capturer le plus précisément possible l'environnement dit chimique.
La combinaison de nombreuses requêtes successives de ce type aboutit à ce que l'on appelle une empreinte moléculaire. Ces séquences de nombres simples sont utilisées depuis longtemps en chimioinformatique pour trouver des similitudes structurelles et sont bien adaptées aux applications assistées par ordinateur. Dans leur approche, les auteurs utilisent un grand nombre de telles empreintes digitales pour représenter le plus précisément possible la structure chimique de chaque molécule. "De cette façon, nous avons pu développer un système robuste qui peut être utilisé pour prédire des résultats de réaction complètement différents, " ajoute Marius Kühnemund, "Le même modèle peut être utilisé pour prédire à la fois les rendements et les stéréosélectivités, qui est unique."
Les auteurs ont démontré que leur programme peut être appliqué facilement et permet des prédictions précises, surtout en combinaison avec la robotique moderne, en utilisant un ensemble de données qui n'a pas été créé à l'origine pour l'apprentissage automatique. "Cet ensemble de données ne contient que les ventes relatives des matières premières et aucun rendement exact, " explique Frederik Sandfort. " Pour des rendements exacts, des étalonnages doivent être créés. Cependant, en raison de l'effort élevé requis, cela se fait rarement dans la réalité."
L'équipe continuera à développer son programme et à l'équiper de nouvelles fonctions à l'avenir. Le professeur Frank Glorius est confiant :« Lorsqu'il s'agit d'évaluer de grandes quantités de données complexes, les ordinateurs sont fondamentalement supérieurs à nous. Cependant, notre objectif n'est pas de remplacer les chimistes de synthèse par des machines, mais pour les soutenir le plus efficacement possible. Les modèles basés sur l'intelligence artificielle peuvent changer considérablement la façon dont nous abordons les synthèses chimiques. Mais nous n'en sommes qu'au tout début."