Topologie du réseau de neurones XC. Il se compose de deux parties :NN-E prédit εxc et NN-V prédit vxc . Chaque partie du réseau de neurones est constituée de 4 couches de 100 neurones chacune. Pour les deux parties, des informations sur la densité locale et ses dérivées sont nécessaires. Crédit :Rapports scientifiques (2022). DOI :10.1038/s41598-022-18083-1
Des chercheurs du Center for Materials Technologies de Skoltech ont livré une démonstration de preuve de concept d'une méthode basée sur un réseau de neurones pour créer une interpolation fonctionnelle précise de corrélation d'échange, qui est le composant central de la théorie fonctionnelle de la densité. La DFT, à son tour, est la principale méthode numérique utilisée en physique de la matière condensée et en chimie quantique pour calculer la réactivité des composés, la structure zonale des molécules, la durabilité des matériaux et d'autres propriétés cruciales pour la recherche de nouveaux matériaux, médicaments, etc. L'architecture prometteuse du réseau de neurones a été présentée et analysée dans des rapports scientifiques .
Comme décrit par l'équation de Schrödinger multiélectronique, les mouvements des électrons dans la matière déterminent les propriétés de la structure électronique. Par exemple, la liaison chimique, un concept central de toute chimie, est un mouvement corrélé complexe d'électrons régi par les lois de la mécanique quantique.
Le problème avec l'équation de Schrödinger multiélectronique est que, bien qu'elle soit relativement facile à énoncer, aucune solution analytique n'a été trouvée et la solution numérique est très complexe et difficile. Ici, l'une des principales approches est la méthode de champ moyen (densité), qui décrit l'interaction complexe des électrons en termes de potentiel effectif.
"La théorie de la fonctionnelle de la densité simplifie les choses en utilisant la notion de nuage d'électrons caractérisé par une certaine densité locale au lieu de considérer des électrons individuels", a expliqué le premier auteur de l'étude, l'ingénieur de recherche Skoltech Alexander Ryabov.
"Cependant, cette théorie a une valeur inconnue importante, appelée la fonctionnelle d'échange-corrélation. Jusqu'à récemment, la tendance était de l'approximer analytiquement. C'est-à-dire que les coefficients sous la forme fonctionnelle étaient déterminés sur la base de plusieurs principes physiques connus sans recourir à des réseaux de neurones. . Notre méthode est la première à utiliser un réseau de neurones à deux composants pour cela. Les réseaux de neurones ont été activement utilisés dans cette tâche, mais notre équipe est pionnière dans ce domaine en Russie."
Selon les chercheurs, ce qui les distingue des approches concurrentes, c'est que la formation se déroule en deux étapes :d'abord, un réseau est formé et ses poids sont figés. Puis un autre est enseigné.
"Auparavant, les gens utilisaient un réseau de neurones pour approximer la fonctionnelle de corrélation d'échange, après quoi des dérivés intensifs en calcul devaient être pris pour trouver le potentiel de corrélation d'échange correspondant. Ce sont des dérivés d'un type qui s'avère souvent difficile à calculer avec une précision décente en utilisant un réseau de neurones », a ajouté Petr Zhilyaev, chercheur principal à Skoltech, chercheur principal de l'étude. "Dans notre travail, un réseau de neurones à deux composants se rapproche à la fois du potentiel et du fonctionnel, donc aucune dérivée compliquée n'est impliquée et la charge de calcul est diminuée."
"Pour exécuter les expériences rapportées dans notre article, nous avons implémenté le réseau de neurones dans la suite logicielle Octopus pour la chimie quantique", a déclaré Ryabov. "Nous avons également étudié comment le processus de formation est affecté par des densités non auto-cohérentes. Après avoir ajouté de telles densités dans l'ensemble de données de formation, nous avons observé une amélioration des performances sur les molécules pour lesquelles le réseau neuronal produisait auparavant les pires résultats." Les scientifiques doutent que l'IA de DeepMind soit aussi efficace pour les systèmes à charge fractionnaire qu'il n'y paraît