Un itératif, processus en plusieurs étapes pour la formation d'un réseau de neurones, comme illustré en haut à gauche, conduit à une évaluation des compromis entre deux qualités concurrentes, comme illustré dans le graphique au centre. La ligne bleue représente un front dit de Pareto, définir les cas au-delà desquels la sélection des matériaux ne peut plus être améliorée. Cela permet d'identifier des catégories spécifiques de nouveaux matériaux prometteurs, tel que celui représenté par le diagramme moléculaire à droite. Crédit :Massachusetts Institute of Technology
Lors de la recherche dans les listes théoriques de nouveaux matériaux possibles pour des applications particulières, tels que des piles ou d'autres appareils liés à l'énergie, il y a souvent des millions de matériaux potentiels qui pourraient être considérés, et plusieurs critères qui doivent être remplis et optimisés à la fois. Maintenant, les chercheurs du MIT ont trouvé un moyen de rationaliser considérablement le processus de découverte, à l'aide d'un système d'apprentissage automatique.
A titre de démonstration, l'équipe est arrivée à un ensemble des huit matériaux les plus prometteurs, sur près de 3 millions de candidats, pour un système de stockage d'énergie appelé batterie à flux. Ce processus d'abattage aurait pris 50 ans par les méthodes analytiques conventionnelles, ils disent, mais ils l'ont accompli en cinq semaines.
Les résultats sont rapportés dans le journal ACS Science centrale , dans un article de Heather Kulik, professeure de génie chimique au MIT, Jon Paul Janet Ph.D. '19, Sahasrajit Ramesh, et étudiant diplômé Chenru Duan.
L'étude a porté sur un ensemble de matériaux appelés complexes de métaux de transition. Celles-ci peuvent exister sous de nombreuses formes différentes, et Kulik dit qu'ils "sont vraiment fascinants, matériaux fonctionnels qui sont différents de beaucoup d'autres phases matérielles. La seule façon de comprendre pourquoi ils fonctionnent comme ils le font est de les étudier en utilisant la mécanique quantique. »
Pour prédire les propriétés de l'un quelconque de ces millions de matériaux, il faudrait soit une spectroscopie longue et gourmande en ressources, soit d'autres travaux de laboratoire, ou chronophage, modélisation informatique hautement complexe basée sur la physique pour chaque matériau candidat possible ou combinaison de matériaux. Chacune de ces études pourrait nécessiter des heures voire des jours de travail.
Au lieu, Kulik et son équipe ont pris un petit nombre de différents matériaux possibles et les ont utilisés pour enseigner à un réseau neuronal avancé d'apprentissage automatique la relation entre les compositions chimiques des matériaux et leurs propriétés physiques. Ces connaissances ont ensuite été appliquées pour générer des suggestions pour la prochaine génération de matériaux possibles à utiliser pour le prochain cycle de formation du réseau de neurones. À travers quatre itérations successives de ce processus, le réseau de neurones s'est considérablement amélioré à chaque fois, jusqu'à atteindre un point où il était clair que d'autres itérations n'apporteraient aucune amélioration supplémentaire.
Ce système d'optimisation itératif a grandement simplifié le processus d'arriver à des solutions potentielles qui satisfont aux deux critères contradictoires recherchés. Ce genre de processus consistant à trouver les meilleures solutions dans des situations, où l'amélioration d'un facteur tend à aggraver l'autre, est connu comme un front de Pareto, représentant un graphique des points tel que toute amélioration supplémentaire d'un facteur aggraverait l'autre. En d'autres termes, le graphique représente les meilleurs points de compromis possibles, en fonction de l'importance relative attribuée à chaque facteur.
La formation de réseaux de neurones typiques nécessite de très grands ensembles de données, allant de milliers à des millions d'exemples, mais Kulik et son équipe ont pu utiliser ce processus itératif, basé sur le modèle frontal de Pareto, pour rationaliser le processus et fournir des résultats fiables en utilisant seulement quelques centaines d'échantillons.
Dans le cas du criblage des matériaux de la batterie d'écoulement, les caractéristiques souhaitées étaient en conflit, comme c'est souvent le cas :Le matériau optimal aurait une solubilité élevée et une densité énergétique élevée (la capacité à stocker de l'énergie pour un poids donné). Mais l'augmentation de la solubilité a tendance à diminuer la densité d'énergie, et vice versa.
Non seulement le réseau de neurones a-t-il été en mesure de trouver rapidement des candidats prometteurs, il a également été en mesure d'attribuer des niveaux de confiance à ses différentes prédictions à chaque itération, ce qui a permis d'affiner la sélection de l'échantillon à chaque étape. « Nous avons développé une technique de quantification de l'incertitude meilleure que la meilleure de sa catégorie pour savoir vraiment quand ces modèles allaient échouer, " dit Kulik.
Le défi qu'ils ont choisi pour l'essai de validation de principe était les matériaux à utiliser dans les batteries à flux redox, un type de batterie qui est prometteur pour les gros, batteries à l'échelle du réseau qui pourraient jouer un rôle important en permettant des énergie renouvelable. Les complexes de métaux de transition sont la catégorie préférée de matériaux pour de telles batteries, Kulik dit, mais il y a trop de possibilités à évaluer par des moyens conventionnels. Ils ont commencé avec une liste de 3 millions de tels complexes avant de finalement réduire cela aux huit bons candidats, ainsi qu'un ensemble de règles de conception qui devraient permettre aux expérimentateurs d'explorer le potentiel de ces candidats et leurs déclinaisons.
« Grâce à ce processus, le réseau neuronal devient de plus en plus intelligent à propos de l'espace [conception], mais aussi de plus en plus pessimiste que tout ce qui va au-delà de ce que nous avons déjà caractérisé peut encore améliorer ce que nous savons déjà, " elle dit.
Outre les complexes de métaux de transition spécifiques suggérés pour une étude plus approfondie en utilisant ce système, elle dit, la méthode elle-même pourrait avoir des applications beaucoup plus larges. "Nous le considérons comme le cadre qui peut être appliqué à tout défi de conception de matériaux où vous essayez vraiment d'atteindre plusieurs objectifs à la fois. Vous savez, tous les défis de conception de matériaux les plus intéressants sont ceux où vous essayez d'améliorer une chose, mais l'amélioration qui en aggrave une autre. Et pour nous, le couple redox de la batterie à flux redox n'était qu'une bonne démonstration de ce que nous pensons pouvoir aller avec cet apprentissage automatique et cette découverte accélérée de matériaux."
Par exemple, l'optimisation des catalyseurs pour divers procédés chimiques et industriels est un autre type de recherche de matériaux complexes, dit Kulik. Les catalyseurs actuellement utilisés comportent souvent des éléments rares et coûteux, ainsi, trouver des composés tout aussi efficaces basés sur des matériaux abondants et peu coûteux pourrait être un avantage significatif.
« Ce papier représente, Je crois, la première application de l'amélioration dirigée multidimensionnelle dans les sciences chimiques, " dit-elle. Mais l'importance à long terme du travail réside dans la méthodologie elle-même, à cause de choses qui ne seraient peut-être pas possibles du tout autrement. "Vous commencez à réaliser que même avec des calculs parallèles, ce sont des cas où nous n'aurions pas proposé un principe de conception d'une autre manière. Et ces pistes qui sortent de notre travail, ce ne sont pas forcément du tout des idées qui étaient déjà connues de la littérature ou qu'un expert aurait pu vous pointer."
"C'est une belle combinaison de concepts en statistiques, mathématiques appliquées, et la science physique qui va être extrêmement utile dans les applications d'ingénierie, " dit Georges Schatz, professeur de chimie et de génie chimique et biologique à la Northwestern University, qui n'était pas associé à ce travail. Il dit que cette recherche porte sur "comment faire de l'apprentissage automatique lorsqu'il y a plusieurs objectifs. L'approche de Kulik utilise des méthodes de pointe pour former un réseau neuronal artificiel qui est utilisé pour prédire quelle combinaison d'ions de métaux de transition et de ligands organiques sera la meilleure pour la batterie à flux redox électrolytes."
Schatz dit, « Cette méthode peut être utilisée dans de nombreux contextes différents, il a donc le potentiel de transformer l'apprentissage automatique, qui est une activité majeure dans le monde.
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.