Crédit :École internationale d'études avancées (SISSA)
L'information est encodée dans les données. Cela est vrai pour la plupart des aspects de la vie moderne, mais c'est aussi vrai dans la plupart des branches de la physique contemporaine, et extraire des informations utiles et significatives à partir de très grands ensembles de données est une mission clé pour de nombreux physiciens.
En mécanique statistique, les grands ensembles de données sont des affaires quotidiennes. Un exemple classique est la fonction de partition, un objet mathématique complexe qui décrit des systèmes physiques à l'équilibre. Cet objet mathématique peut être vu comme étant constitué de plusieurs points, chacun décrivant un degré de liberté d'un système physique, c'est-à-dire le nombre minimum de données pouvant décrire toutes ses propriétés.
Une équipe interdisciplinaire de scientifiques du Centre international Abdus Salam de physique théorique (ICTP) et de la Scuola Internazionale Superiore di Studi Avanzati (SISSA) a montré qu'une collecte aussi massive de données peut être passée au peigne fin, faire ressortir les propriétés physiques fondamentales d'un système inconnu.
Ces résultats ont été soulignés dans un article qui vient d'être publié dans Examen physique X , introduire un nouveau point de vue basé sur les données sur les transitions de phase. L'équipe a montré qu'une propriété statistique générique des grands ensembles de données qui décrivent un large éventail de systèmes physiques à l'équilibre, dite dimension intrinsèque, peut en effet révéler l'occurrence d'une transition de phase.
Les auteurs de l'article, coordonné par Marcello Dalmonte, chercheur à la Section Matière Condensée et Physique Statistique de l'ICTP et collaborateur de SISSA, viennent d'horizons différents. Tiago Mendès, un ancien post-doctorant à l'ICTP et maintenant à l'Institut Max Planck de Physique des Systèmes Complexes, à Dresde, Allemagne, travaille principalement sur les méthodes numériques appliquées à la mécanique statistique. Alex Rodriguez est chimiste, auparavant chez SISSA et maintenant chez ICTP, qui travaille dans la mise en œuvre d'algorithmes de systèmes complexes et le développement de méthodes d'apprentissage automatique. Xhek Turkeshi, un doctorat étudiant à SISSA, travaille principalement en physique statistique.
Les chercheurs se sont concentrés sur une propriété statistique générique des ensembles de données, appelée dimension intrinsèque. La façon la plus simple de décrire cette propriété est comme le nombre minimum de variables nécessaires pour représenter un ensemble de données donné, sans aucune perte d'informations. "Prendre, par exemple, tous les gens du monde entier, " explique Rodriguez. " C'est un ensemble de données en soi. Maintenant, si vous voulez préciser la position des personnes dans le monde, en théorie, vous auriez besoin des coordonnées de toutes leurs positions dans l'espace, C'est, trois données pour chaque personne. Mais puisque nous pouvons approximer la Terre comme une surface bidimensionnelle, nous n'aurons besoin que de deux paramètres, C'est, la latitude et la longitude. C'est ce qu'est la dimension intrinsèque :si l'ensemble de données était l'humanité, alors la dimension intrinsèque serait 2, pas 3."
Dans le contexte plus théorique des systèmes statistiques, l'article montre que cette propriété de dimension intrinsèque peut révéler des propriétés collectives des fonctions de partition aux transitions de phases thermiques. Cela signifie que, quel que soit le système envisagé, les données peuvent montrer si et quand ce système subit une transition de phase. L'équipe a développé un cadre théorique pour expliquer pourquoi les données génériques présentent un tel comportement « universel », commun à un large éventail de transitions de phase différentes, de la fonte des glaces aux ferroaimants.
"Le travail introduit un nouveau point de vue sur les transitions de phase en montrant comment la dimension intrinsèque révèle les transitions structurelles correspondantes dans l'espace de données, " disent les scientifiques, "quand la glace fond, sa structure de données le fait aussi."
Ce qui est vraiment nouveau dans ce travail, c'est que les données brutes reflètent le comportement physique des systèmes considérés, et c'est important pour les physiciens, car cela leur permet d'analyser un système sans connaître la physique qui le sous-tend. Il suffit de regarder les données pour voir s'il y a une transition dans le système ou non, sans même savoir de quel genre de transition il s'agit. "On pourrait dire que cette méthode est complètement agnostique, " dit Mendes. " Vous n'avez pas besoin de connaître a priori tous les paramètres du système; vous travaillez simplement avec des données brutes et voyez ce qui en sort."
Après les résultats intéressants obtenus dans cette recherche, l'équipe envisage de continuer à travailler ensemble dans la même direction, élargir leur champ d'analyse. Ils travaillent déjà sur un deuxième papier, en se concentrant sur les soi-disant « transitions de phase quantiques », C'est, les systèmes quantiques où les transitions de phase se produisent à une température égale à zéro et sont induites par des paramètres externes, comme le champ magnétique.
En termes d'applications de ces résultats, les possibilités sont nombreuses - des expériences avec des simulations informatiques de systèmes quantiques aux branches plus fondamentales de la physique, comme la chromodynamique quantique, cela pourrait aussi avoir un impact sur la physique nucléaire. "Une possibilité intéressante d'application réside dans l'utilisation de techniques de physique statistique pour comprendre l'apprentissage automatique, " dit Rodriguez. " Dans ce genre de recherche, qui va de l'informatique quantique à l'étude des réseaux de neurones par exemple, des transitions de phase sont très souvent impliquées et nous pourrions essayer d'utiliser notre méthode pour résoudre tous ces types de problèmes différents."