Un exemple de données de diffraction des rayons X 3D passant par une transition de phase lors du refroidissement. Le tracé magenta montre des points spéciaux associés à la formation d'ondes de densité de charge tels qu'ils ont été révélés par l'algorithme d'apprentissage automatique X-TEC. Crédit :Krishna Mallayya/Fourni
Les électrons et leur comportement posent des questions fascinantes aux physiciens quantiques, et les innovations récentes en matière de sources, d'instruments et d'installations permettent aux chercheurs d'accéder potentiellement à encore plus d'informations codées dans les matériaux quantiques.
Cependant, ces innovations de la recherche produisent des volumes de données sans précédent, et jusqu'à présent indéchiffrables.
"Le contenu informatif d'un document peut rapidement dépasser le contenu informatif total de la Bibliothèque du Congrès, qui est d'environ 20 téraoctets", a déclaré Eun-Ah Kim, professeur de physique au Collège des arts et des sciences, qui est au à la pointe de la recherche sur les matériaux quantiques et de l'exploitation de la puissance de l'apprentissage automatique pour analyser les données d'expériences sur les matériaux quantiques.
"La capacité limitée du mode d'analyse traditionnel, en grande partie manuel, devient rapidement le goulot d'étranglement critique", a déclaré Kim.
Un groupe dirigé par Kim a utilisé avec succès une technique d'apprentissage automatique développée avec des informaticiens de Cornell pour analyser d'énormes quantités de données à partir du métal quantique Cd2 Re2 O7 , régler un débat sur ce matériau particulier et préparer le terrain pour un futur apprentissage automatique a permis de mieux comprendre les nouvelles phases de la matière.
L'article, "Harnessing Interpretable and Unsupervised Machine Learning to Address Big Data from Modern X-ray Diffraction", publié le 9 juin dans Proceedings of the National Academy of Sciences .
Des physiciens et des informaticiens de Cornell ont collaboré pour créer un algorithme d'apprentissage automatique non supervisé et interprétable, XRD Temperature Clustering (X-TEC). Les chercheurs ont ensuite appliqué X-TEC pour étudier les éléments clés du métal d'oxyde de pyrochlore, Cd2 Re2 O7 .
X-TEC a analysé huit téraoctets de données de rayons X, couvrant 15 000 zones Brillouin (cellules définies de manière unique), en quelques minutes.
"Nous avons utilisé des algorithmes d'apprentissage automatique non supervisés, qui conviennent parfaitement pour traduire des données de grande dimension en clusters qui ont du sens pour les humains", a déclaré Kilian Weinberger, professeur d'informatique à Cornell Ann. Collège S Bowers d'informatique et de sciences de l'information.
Grâce à cette analyse, les chercheurs ont découvert des informations importantes sur le comportement des électrons dans le matériau, détectant ce que l'on appelle le mode pseudo-Goldstone. Ils essayaient de comprendre comment les atomes et les électrons se positionnent de manière ordonnée pour optimiser l'interaction au sein de la "communauté" astronomique des électrons et des atomes.
"Dans les matériaux cristallins complexes, une structure spécifique de plusieurs atomes, la cellule unitaire, se répète dans un arrangement régulier comme dans un complexe d'appartements de grande hauteur", a déclaré Kim. "Le repositionnement que nous avons découvert se produit à l'échelle de chaque appartement, dans l'ensemble du complexe."
Parce que la disposition des unités reste la même, a-t-elle dit, il est difficile de détecter ce repositionnement en regardant de l'extérieur. Cependant, le repositionnement brise presque spontanément une symétrie continue, ce qui se traduit par un mode pseudo-Goldstone.
"L'existence du mode pseudo-Goldstone peut révéler les symétries secrètes du système qui peuvent être difficiles à voir autrement", a déclaré Kim. "Notre découverte a été rendue possible par X-TEC."
Cette découverte est importante pour trois raisons, a déclaré Kim. Tout d'abord, il montre que l'apprentissage automatique peut être utilisé pour analyser de volumineuses données de diffraction des rayons X sur poudre (XRD), servant de prototype pour les applications de X-TEC à mesure qu'il évolue. X-TEC, disponible pour les chercheurs sous forme de progiciel, sera intégré au synchrotron en tant qu'outil d'analyse à l'Advanced Photon Source et à la Cornell High Energy Synchrotron Source.
Deuxièmement, la découverte règle un débat concernant la physique du Cd2 Re2 O7 .
"Au meilleur de notre connaissance, il s'agit du premier cas de détection d'un mode Goldstone utilisant XRD", a déclaré Kim. "Cette vision à l'échelle atomique des fluctuations d'un matériau quantique complexe ne sera que le premier exemple de réponse aux questions scientifiques clés accompagnant toute découverte de nouvelles phases de la matière... en utilisant des données de diffraction volumineuses et riches en informations."
Troisièmement, la découverte montre ce que la collaboration entre physiciens et informaticiens peut accomplir.
"Les rouages mathématiques internes des algorithmes d'apprentissage automatique ne sont souvent pas différents des modèles en physique, mais appliqués à des données de grande dimension", a déclaré Weinberger. "Travailler avec des physiciens est très amusant, car ils sont si doués pour modéliser le monde naturel. En ce qui concerne la modélisation des données, ils sont vraiment très efficaces." La théorie suggère que les ordinateurs quantiques devraient être exponentiellement plus rapides sur certaines tâches d'apprentissage que les machines classiques