Vue d'artiste de l'architecture d'apprentissage automatique qui code explicitement la symétrie de jauge pour une théorie des champs en réseau 2D. Crédit :collaboration MIT-DeepMind.
Le modèle standard de la physique des particules décrit toutes les particules élémentaires connues et trois des quatre forces fondamentales régissant l'univers; tout sauf la gravité. Ces trois forces - électromagnétiques, fort, et faible - régissent la formation des particules, comment ils interagissent, et comment les particules se désintègrent.
Étudier la physique des particules et nucléaire dans ce cadre, cependant, est difficile, et s'appuie sur des études numériques à grande échelle. Par exemple, de nombreux aspects de la force forte nécessitent de simuler numériquement la dynamique à l'échelle du 1/10e au 1/100e de la taille d'un proton pour répondre à des questions fondamentales sur les propriétés des protons, neutrons, et les noyaux.
"Finalement, nous sommes limités en termes de calcul dans l'étude de la structure du proton et du nucléaire en utilisant la théorie des champs de réseau, " explique le professeur assistant de physique Phiala Shanahan. " Il y a beaucoup de problèmes intéressants que nous savons aborder en principe, mais nous n'avons tout simplement pas assez de calcul, même si nous fonctionnons sur les plus gros supercalculateurs du monde."
Pour dépasser ces limites, Shanahan dirige un groupe qui combine la physique théorique avec des modèles d'apprentissage automatique. Dans leur article "Equivariant flow-based sampling for lattice jauge theory, " publié ce mois-ci dans Lettres d'examen physique , ils montrent comment l'incorporation des symétries des théories physiques dans les architectures d'apprentissage automatique et d'intelligence artificielle peut fournir des algorithmes beaucoup plus rapides pour la physique théorique.
"Nous utilisons l'apprentissage automatique pour ne pas analyser de grandes quantités de données, mais pour accélérer la théorie des principes premiers d'une manière qui ne compromet pas la rigueur de l'approche, " dit Shanahan. " Ce travail particulier a démontré que nous pouvons construire des architectures d'apprentissage automatique avec certaines des symétries du modèle standard de la physique des particules et nucléaire intégré, et d'accélérer le problème d'échantillonnage que nous ciblons par ordre de grandeur."
Shanahan a lancé le projet avec l'étudiant diplômé du MIT Gurtej Kanwar et avec Michael Albergo, qui est maintenant à NYU. Le projet s'est élargi pour inclure les post-doctorants du Center for Theoretical Physics Daniel Hackett et Denis Boyda, Professeur de NYU Kyle Cranmer, et des scientifiques connaisseurs en physique de l'apprentissage automatique chez Google Deep Mind, Sébastien Racanière et Danilo Jiménez Rezende.
L'article de ce mois fait partie d'une série visant à permettre des études en physique théorique qui sont actuellement insolubles sur le plan informatique. "Notre objectif est de développer de nouveaux algorithmes pour une composante clé des calculs numériques en physique théorique, " dit Kanwar. " Ces calculs nous renseignent sur le fonctionnement interne du modèle standard de la physique des particules, notre théorie la plus fondamentale de la matière. De tels calculs sont d'une importance vitale pour comparer avec les résultats d'expériences de physique des particules, comme le Grand collisionneur de hadrons au CERN, à la fois pour contraindre le modèle plus précisément et pour découvrir où le modèle s'effondre et doit être étendu à quelque chose d'encore plus fondamental."
La seule méthode connue et systématiquement contrôlable pour étudier le modèle standard de la physique des particules dans le régime non perturbatif est basée sur un échantillonnage d'instantanés de fluctuations quantiques dans le vide. En mesurant les propriétés de ces fluctuations, une fois peut déduire les propriétés des particules et des collisions d'intérêt.
Cette technique comporte des défis, Kanwar explique. "Cet échantillonnage coûte cher, et nous cherchons à utiliser des techniques d'apprentissage automatique inspirées de la physique pour dessiner des échantillons beaucoup plus efficacement, " dit-il. " L'apprentissage automatique a déjà fait de grands progrès sur la génération d'images, comprenant, par exemple, travaux récents de NVIDIA pour générer des images de visages "rêvés" par des réseaux de neurones. Considérant ces instantanés du vide comme des images, nous pensons qu'il est tout à fait naturel de se tourner vers des méthodes similaires pour notre problème."
Ajoute Shanahan, "Dans notre approche d'échantillonnage de ces instantanés quantiques, nous optimisons un modèle qui nous fait passer d'un espace facile à échantillonner à l'espace cible :étant donné un modèle entraîné, l'échantillonnage est alors efficace puisqu'il suffit de prélever des échantillons indépendants dans l'espace facile à échantillonner, et les transformer via le modèle appris."
En particulier, le groupe a mis en place un framework pour construire des modèles d'apprentissage automatique qui respectent exactement une classe de symétries, appelé "symétries de jauge, " crucial pour l'étude de la physique des hautes énergies.
Comme preuve de principe, Shanahan et ses collègues ont utilisé leur cadre pour former des modèles d'apprentissage automatique afin de simuler une théorie en deux dimensions, résultant en des gains d'efficacité de plusieurs ordres de grandeur par rapport aux techniques de pointe et des prédictions plus précises de la théorie. Cela ouvre la voie à une recherche considérablement accélérée sur les forces fondamentales de la nature à l'aide d'un apprentissage automatique basé sur la physique.
Les premiers articles du groupe en tant que collaboration traitaient de l'application de la technique d'apprentissage automatique à une théorie des champs de réseau simple, et développé cette classe d'approches sur compact, des variétés connectées qui décrivent les théories des champs plus compliquées du modèle standard. Maintenant, ils travaillent à adapter les techniques aux calculs de pointe.
"Je pense que nous avons montré au cours de l'année écoulée qu'il y a beaucoup de promesses dans la combinaison des connaissances physiques avec des techniques d'apprentissage automatique, " dit Kanwar. " Nous réfléchissons activement à la manière de surmonter les obstacles restants dans la manière d'effectuer des simulations à grande échelle en utilisant notre approche. J'espère voir la première application de ces méthodes aux calculs à grande échelle dans les deux prochaines années. Si nous sommes capables de surmonter les derniers obstacles, cela promet d'étendre ce que nous pouvons faire avec des ressources limitées, et je rêve d'effectuer bientôt des calculs qui nous donneront de nouvelles perspectives sur ce qui dépasse notre meilleure compréhension de la physique aujourd'hui."
Cette idée d'apprentissage automatique basé sur la physique est également connue par l'équipe sous le nom d'« IA ab-initio, " un thème clé de l'Institut pour l'intelligence artificielle et les interactions fondamentales (IAIFI) de la National Science Foundation récemment lancé au MIT, où Shanahan est coordinateur de recherche pour la théorie physique.