Le calorimètre amélioré à haute granularité – un composant du détecteur CMS du Grand collisionneur de hadrons – produit des images complexes de particules générées par les collisions. Les chercheurs travaillent à la mise en œuvre de réseaux de neurones graphiques pour optimiser l'analyse de ces données afin de mieux identifier et caractériser les interactions de particules d'intérêt. Crédit :Ziheng Chen, Université du nord-ouest
Les algorithmes d'apprentissage automatique peuvent battre les jeux vidéo les plus difficiles du monde en quelques minutes et résoudre des équations complexes plus rapidement que les efforts collectifs de générations de physiciens. Mais les algorithmes conventionnels ont toujours du mal à repérer les panneaux d'arrêt dans une rue animée.
L'identification d'objets continue d'entraver le domaine de l'apprentissage automatique, en particulier lorsque les images sont multidimensionnelles et compliquées, comme celles que prennent les détecteurs de particules lors des collisions dans les expériences de physique des hautes énergies. Cependant, une nouvelle classe de réseaux de neurones aide ces modèles à augmenter leurs capacités de reconnaissance de formes, et la technologie pourrait bientôt être mise en œuvre dans des expériences de physique des particules pour optimiser l'analyse des données.
Cet été, Les physiciens du Laboratoire Fermi ont fait des progrès dans leurs efforts pour intégrer des réseaux de neurones graphiques dans les systèmes expérimentaux. La scientifique Lindsey Gray a mis à jour le logiciel qui permet de déployer ces algorithmes de pointe sur les données du Grand collisionneur de hadrons du CERN. Pour la première fois, ces réseaux seront intégrés dans des expériences de physique des particules pour traiter directement les données des détecteurs, ouvrant ainsi les portes d'une augmentation majeure de l'efficacité qui fournira des informations plus précises à partir des détecteurs actuels et futurs.
"Ce qui n'était il y a une semaine qu'un objet de recherche est maintenant un outil largement utilisable qui pourrait transformer notre capacité à analyser les données d'expériences de physique des particules, " dit Gray.
Ses travaux portent initialement sur l'utilisation de réseaux de neurones graphes pour analyser les données de l'expérience CMS au LHC, l'une des quatre principales expériences de physique des particules du collisionneur.
Les programmeurs développent des réseaux de neurones pour passer au crible des montagnes de données à la recherche d'une catégorie ou d'une quantité spécifique, par exemple, un panneau d'arrêt sur une photo d'une rue bondée.
Les photographies numériques normales sont essentiellement une grille géante de rouge, pixels carrés verts et bleus. Après avoir été formé pour reconnaître à quoi ressemble un panneau d'arrêt, les réseaux de neurones classiques inspectent l'ensemble du bloc de pixels pour voir si la cible est présente ou non. Cette méthode est inefficace, cependant, puisque les modèles doivent traiter beaucoup de choses non pertinentes, obscurcissement des données.
Les informaticiens ont développé de nouvelles classes de réseaux de neurones pour améliorer ce processus, mais les algorithmes ont encore du mal à identifier des objets dans des images plus complexes qu'une simple grille bidimensionnelle de pixels carrés.
Prenez des molécules, par exemple. Afin de déterminer si un produit chimique est toxique ou non, les chimistes doivent localiser certaines caractéristiques telles que les anneaux carbonés et les groupes carboxyle au sein d'une molécule. Les photographies des produits chimiques prises avec des machines de chromatographie à rayons X produisent des images 3D d'atomes liés, qui semblent légèrement différents à chaque fois qu'ils sont consultés.
Étant donné que les données ne sont pas stockées dans une grille carrée, il est difficile pour les réseaux neuronaux typiques d'apprendre à identifier les composés toxiques. Pour contourner cela, les chimistes ont commencé à utiliser un nouvel ensemble de réseaux de neurones :les réseaux de neurones de graphes, ou GNN.
Contrairement à ces réseaux de neurones typiques, Les GNN sont capables de dire quels pixels sont connectés les uns aux autres même s'ils ne sont pas dans une grille 2D. En utilisant les « bords » entre les « nœuds » de données (dans ce cas, les liaisons entre les atomes), ces modèles d'apprentissage automatique peuvent identifier les sujets souhaités beaucoup plus efficacement.
La vision de Gray est d'apporter ces modèles et leur identification améliorée des cibles pour rationaliser le traitement des données pour les collisions de particules.
"Avec un réseau de neurones graphiques, vous pouvez écrire un algorithme de reconnaissance de formes bien meilleur à utiliser pour quelque chose d'aussi complexe que les données d'un accélérateur de particules, car il a la capacité d'examiner les relations entre toutes les données entrantes pour trouver les parties les plus pertinentes de ces informations, " il a dit.
Le détecteur CMS du Large Hadron Collider prend des milliards d'images de collisions à haute énergie chaque seconde pour rechercher des preuves de nouvelles particules. Les réseaux de neurones graphiques décident rapidement lesquelles de ces données conserver pour une analyse plus approfondie. Crédit :CERN
Les recherches de Gray se concentrent sur la mise en œuvre des GNN dans le calorimètre à haute granularité du détecteur CMS, ou HGCal. CMS prend des milliards d'images de collisions à haute énergie chaque seconde pour rechercher des preuves de nouvelles particules.
L'un des défis du calorimètre est qu'il collecte tellement de données (assez d'images pour remplir 20 millions d'iPhones par seconde) qu'une grande majorité doit être jetée en raison des limitations de l'espace de stockage. Les systèmes de déclenchement du HGCal doivent décider en quelques millionièmes de seconde quelles parties des données sont intéressantes et doivent être sauvegardées. Le reste est supprimé.
"Si vous disposez d'un réseau de neurones que vous pouvez optimiser pour qu'il s'exécute dans un certain laps de temps, alors vous pouvez prendre ces décisions de manière plus fiable. Vous ne manquez rien, et tu ne gardes pas les choses dont tu n'as pas vraiment besoin, " a déclaré Kevin Pedro, un autre scientifique du Fermilab travaillant avec Gray.
Les détecteurs HGCal collectent simultanément de nombreuses informations différentes sur les interactions des particules, ce qui produit des images très compliquées.
"Ces données ont une forme étrange, ils ont des lacunes aléatoires en eux, et ils ne sont même pas proches d'une grille contiguë de carrés, " Dit Gray. "C'est là qu'interviennent les graphiques, parce qu'ils vous permettent d'ignorer tout ce qui n'a pas de sens."
En théorie, les GNN seraient formés pour analyser les connexions entre les pixels d'intérêt et seraient capables de prédire quelles images devraient être enregistrées et lesquelles peuvent être supprimées de manière beaucoup plus efficace et précise. Cependant, parce que cette classe de réseau neuronal est si nouvelle pour la physique des particules, il n'est pas encore possible de les implémenter directement dans le matériel de déclenchement.
Le réseau de neurones graphes est bien adapté au HGCal d'une autre manière :Les modules du HGCal sont hexagonaux, une géométrie qui, bien qu'incompatible avec d'autres types de réseaux de neurones, fonctionne bien avec les GNN.
"C'est ce qui fait de ce projet particulier une percée, " a déclaré Liz Sexton-Kennedy, directrice de l'information du Fermilab. " Cela montre l'ingéniosité de Kevin et Lindsey :ils ont travaillé en étroite collaboration avec des collègues qui ont conçu le calorimètre, et ils ont mis à profit leur expertise unique en matière de logiciels pour étendre davantage les capacités de l'expérience. »
Gray a également réussi à écrire un code qui étend les capacités de PyTorch, un framework d'apprentissage automatique open source largement utilisé, pour permettre aux modèles de réseaux de neurones graphiques d'être exécutés à distance sur des appareils du monde entier.
"Avant cela, il était extrêmement maladroit et détourné de construire un modèle puis de le déployer, " dit Gray. " Maintenant que c'est fonctionnel, vous envoyez simplement des données dans le service, il trouve comment l'exécuter au mieux, puis la sortie vous est renvoyée."
Gray et Pedro ont déclaré qu'ils espèrent que les réseaux de neurones graphiques seront fonctionnels d'ici la reprise de l'exécution 3 du LHC en 2021. De cette façon, les modèles peuvent être entraînés et testés avant la mise à niveau à haute luminosité du collisionneur, dont les capacités accrues de collecte de données rendront les GNN encore plus précieux.
Une fois les réseaux opérationnels au même endroit, il devrait être beaucoup plus facile de les faire travailler dans d'autres expériences autour du laboratoire.
"Vous pouvez toujours appliquer toutes les mêmes choses que nous apprenons sur les réseaux de neurones graphiques dans le HGCal à d'autres détecteurs dans d'autres expériences, " Gray a déclaré. " La vitesse à laquelle nous adoptons l'apprentissage automatique en physique des hautes énergies n'est même pas encore proche de la saturation. Les gens continueront à trouver de plus en plus de façons de l'appliquer. »