Crédit :CC0 Domaine public
Concevoir les meilleurs blocs de construction moléculaires pour les composants de la batterie, c'est comme essayer de créer une recette pour un nouveau type de gâteau, quand vous avez des milliards d'ingrédients potentiels. Le défi consiste à déterminer quels ingrédients fonctionnent le mieux ensemble ou, plus simplement, produire un comestible (ou, dans le cas des piles, un produit sûr). Mais même avec des supercalculateurs de pointe, les scientifiques ne peuvent pas modéliser avec précision les caractéristiques chimiques de chaque molécule qui pourrait s'avérer être la base d'un matériau de batterie de nouvelle génération.
Au lieu, Des chercheurs du laboratoire national d'Argonne du département américain de l'Énergie (DOE) se sont tournés vers la puissance de l'apprentissage automatique et de l'intelligence artificielle pour accélérer considérablement le processus de découverte des batteries.
Comme décrit dans deux nouveaux articles, Les chercheurs d'Argonne ont d'abord créé une base de données très précise d'environ 133, 000 petites molécules organiques qui pourraient constituer la base des électrolytes des batteries. Faire cela, ils ont utilisé un modèle de calcul intensif appelé G4MP2. Cette collection de molécules, cependant, ne représentait qu'un petit sous-ensemble de 166 milliards de molécules plus grosses que les scientifiques voulaient sonder pour des candidats électrolytes.
Parce que l'utilisation de G4MP2 pour résoudre chacune des 166 milliards de molécules aurait nécessité un temps et une puissance de calcul impossibles, l'équipe de recherche a utilisé un algorithme d'apprentissage automatique pour relier les structures connues avec précision à partir du plus petit ensemble de données à des structures modélisées beaucoup plus grossièrement à partir du plus grand ensemble de données.
"Quand il s'agit de déterminer le fonctionnement de ces molécules, il y a de gros compromis entre la précision et le temps qu'il faut pour calculer un résultat, " a déclaré Ian Foster, Directeur de la division Data Science and Learning d'Argonne et auteur de l'un des articles. "Nous pensons que l'apprentissage automatique représente un moyen d'obtenir une image moléculaire presque aussi précise à une fraction du coût de calcul."
Pour fournir une base pour le modèle d'apprentissage automatique, Foster et ses collègues ont utilisé un cadre de modélisation moins exigeant en calcul basé sur la théorie de la fonctionnelle de la densité, un cadre de modélisation de la mécanique quantique utilisé pour calculer la structure électronique dans les grands systèmes. La théorie fonctionnelle de la densité fournit une bonne approximation des propriétés moléculaires, mais est moins précis que G4MP2.
Affiner l'algorithme pour mieux déterminer les informations sur la classe plus large de molécules organiques impliquait de comparer les positions atomiques des molécules calculées avec le G4MP2 très précis par rapport à celles analysées en utilisant uniquement la théorie fonctionnelle de la densité. En utilisant G4MP2 comme étalon-or, les chercheurs pourraient entraîner le modèle de théorie fonctionnelle de la densité à incorporer un facteur de correction, améliorer sa précision tout en réduisant les coûts de calcul.
"L'algorithme d'apprentissage automatique nous donne un moyen d'examiner la relation entre les atomes d'une grosse molécule et leurs voisins, pour voir comment ils se lient et interagissent, et rechercher des similitudes entre ces molécules et d'autres que nous connaissons assez bien, " a déclaré Logan Ward, informaticien d'Argonne, un auteur de l'une des études. "Cela nous aidera à faire des prédictions sur les énergies de ces molécules plus grosses ou sur les différences entre les calculs de faible et de haute précision."
"L'ensemble de ce projet est conçu pour nous donner la plus grande image possible des candidats électrolytes de batterie, " a ajouté Rajeev Assary, chimiste d'Argonne, un auteur des deux études. "Si nous allons utiliser une molécule pour des applications de stockage d'énergie, nous devons connaître des propriétés comme sa stabilité, et nous pouvons utiliser cet apprentissage automatique pour prédire avec plus de précision les propriétés de molécules plus grosses."
Un article décrivant la formation de l'ensemble de données basé sur G4MP2, "Énergies chimiques quantiques précises pour 133, 000 molécules organiques, " paru dans le numéro en ligne du 27 juin de Sciences chimiques .
Un deuxième article décrivant l'algorithme d'apprentissage automatique, "Prédiction par apprentissage automatique des énergies d'atomisation précises de molécules organiques à partir de calculs chimiques quantiques basse fidélité, " paru dans le numéro du 27 août de Communication MRS .