• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Chimie
    Les chercheurs consultent la base de données des clusters d'eau, réseau ferroviaire pour prédire les paysages énergétiques

    Les chercheurs du PNNL en ont utilisé 500, 000 clusters d'eau à partir d'une base de données récemment développée de plus de 5 millions de minima de clusters d'eau pour former un réseau de neurones reposant sur la puissance mathématique de la théorie des graphes - une collection de nœuds et de liens représentant la structure moléculaire - pour déchiffrer les modèles structurels de l'agrégation de molécules d'eau. Crédit :Nathan Johnson | PNNL

    Algorithmes d'apprentissage automatique, la base des réseaux de neurones, ouvrent les portes à de nouvelles découvertes - ou du moins offrent des indices alléchants - une énorme base de données à la fois. Exemple concret :les chercheurs du Pacific Northwest National Laboratory (PNNL) ont approfondi la modélisation des interactions entre les molécules d'eau, trouver des informations sur les liaisons hydrogène et les modèles structurels tout en traçant un chemin en utilisant, vous l'aurez deviné, l'apprentissage en profondeur.

    "Les réseaux de neurones sont un moyen pour l'ordinateur d'apprendre automatiquement différentes propriétés des systèmes ou des données, " a déclaré le data scientist du PNNL, Jenna Pape. "Dans ce cas, le réseau de neurones apprend l'énergie de différents réseaux de clusters d'eau sur la base de données précédentes."

    Les chercheurs du PNNL en ont utilisé 500, 000 clusters d'eau à partir d'une base de données récemment développée de plus de 5 millions de minima de clusters d'eau pour former un réseau de neurones reposant sur la puissance mathématique de la théorie des graphes - une collection de nœuds et de liens représentant la structure moléculaire - pour déchiffrer les modèles structurels de l'agrégation de molécules d'eau. Travailler avec le moléculaire, eau sous forme gazeuse, ils ont accordé une attention particulière à la relation entre la liaison hydrogène et l'énergie par rapport à la structure la plus stable.

    "C'est le Saint Graal, " a déclaré Pope. " En ce moment, il faut beaucoup d'efforts pour développer un potentiel d'interaction précis pour l'eau. Mais avec les réseaux de neurones, l'objectif final est de faire apprendre les réseaux, à partir d'un grand ensemble de données, quelle est l'énergie d'un réseau en fonction de sa structure moléculaire sous-jacente."

    Après avoir évalué 500, 000 grappes d'eau, le réseau neuronal de l'étude dirigée par le PNNL a été formé aux différentes manières dont les molécules d'eau interagissent les unes avec les autres. L'ensemble de données aurait théoriquement pu inclure l'ensemble de la base de données de 5 millions de réseaux d'eau. Mais pour des raisons pratiques, non.

    "Utiliser toute la base de données pour entraîner le réseau de neurones aurait pris trop de temps de calcul, " a déclaré Pope. Former les réseaux de neurones profonds pour examiner ces 500, 000 clusters d'eau, soit seulement un dixième de la base de données complète, ont pris plus de deux jours et demi à l'aide de quatre ordinateurs à la pointe de la technologie dotés d'une unité de traitement graphique (GPU) performante, travailler 24 heures sur 24.

    Une partie d'une image plus grande

    Les réseaux de neurones existent depuis des décennies. Une plus grande puissance de traitement des puces GPU au cours des 10 dernières années, cependant, a fortement amélioré la capacité de ces réseaux, également associé à l'expression « apprentissage en profondeur ». Même avec une telle promesse, la formation de réseaux de neurones est un défi de calcul coûteux. Et aussi précis soient-ils, les réseaux de neurones sont souvent critiqués comme des boîtes noires qui n'offrent aucune information sur la raison pour laquelle ils donnent la réponse qu'ils font.

    Le projet Exascale Computing (ECP) du département américain de l'Énergie (DOE) a été lancé en 2016 pour explorer les problèmes de supercalcul les plus difficiles à résoudre, y compris le raffinement des réseaux de neurones. En 2018, ECP a engendré le centre de co-conception ExaLearn, en se concentrant sur les technologies d'apprentissage automatique. Le PNNL fait partie des huit laboratoires nationaux participant au projet ExaLearn. James Ang, Scientifique en chef du PNNL pour l'informatique en Sciences Physiques et Informatiques, anime la participation du Laboratoire.

    Base de données près de chez vous

    L'un des principaux objectifs d'ExaLearn est de développer des technologies d'intelligence artificielle capables de concevoir de nouvelles structures chimiques en apprenant à partir d'ensembles de données massifs. Recherche menée par Sutanay Choudhury, un informaticien du PNNL, puisé dans la base de données massive des clusters d'eau développée sur le campus du PNNL-Richland par Sotiris Xantheas, un boursier du Laboratoire PNNL. Xanthéas, connu en physique chimique pour ses recherches sur les interactions intermoléculaires dans les amas ioniques aqueux, est co-auteur de l'étude sur les réseaux de neurones publiée dans le numéro spécial "Machine Learning Meets Chemical Physics" de la Journal de physique chimique .

    "Plusieurs propriétés macroscopiques de l'eau ont été attribuées à son réseau éphémère de liaisons hydrogène, qui consiste en un réseau dynamique de liaisons qui se brisent et se reforment en une fraction de seconde à température ambiante, " dit Xanthéas, dont le travail de base de données a été soutenu par le Bureau des sciences du DOE, Programme des sciences de l'énergie de base, Sciences chimiques, Géosciences, et Division des sciences biologiques. "Les clusters d'eau fournissent un banc d'essai pour sonder ce réseau de liaisons hydrogène éphémère en comprenant la relation structure-énergie des différents arrangements de liaison hydrogène."

    Les chercheurs du PNNL avaient une stratégie pour déchiffrer cette boîte noire particulière. Ils ont utilisé la théorie des graphes - une branche des mathématiques qui étudie comment les choses sont connectées dans un réseau - pour représenter, sous forme graphique, molécules et leurs sous-structures polygonales. Les descripteurs théoriques des graphes que l'équipe a conçus ont fourni plusieurs informations sur la composition des grappes d'eau.

    "Ce que nous avons fait, " dit le Pape, "est de fournir une analyse supplémentaire après la formation du réseau. L'analyse quantifie différentes propriétés structurelles de ces réseaux de clusters d'eau. Ensuite, nous pouvons les comparer à notre réseau de neurones prédit et, dans les examens ultérieurs des ensembles de données, améliorer la compréhension du réseau."

    L'eau a un avenir de réseau de neurones

    Les résultats de l'étude fournissent une base pour l'analyse des modèles structurels des clusters d'eau dans des réseaux à liaisons hydrogène plus complexes, comme l'eau liquide et la glace.

    « Si vous pouviez entraîner un réseau de neurones, " dit le Pape, "Ce réseau de neurones serait capable de faire de la chimie computationnelle sur des systèmes plus grands. Et puis vous pourriez faire des idées similaires en chimie computationnelle sur la structure chimique ou la liaison hydrogène ou la réponse des molécules aux changements de température. Ce sont parmi les objectifs de cette recherche. "


    © Science https://fr.scienceaq.com