• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Physique
    L'apprentissage automatique modifie qualitativement la recherche de nouvelles particules

    Figure 1 :Diagramme illustrant la construction d'échantillons mixtes pour l'entraînement d'un classificateur CWoLa faiblement supervisé à la chasse aux bosses. Dans la recherche ATLAS, la caractéristique résonante (mres) est la masse du dijet et les autres caractéristiques (y) sont les masses des deux jets. Crédit :Collaboration ATLAS/CERN

    La collaboration ATLAS au CERN explore de nouvelles façons de rechercher de nouveaux phénomènes. Parallèlement à un vaste programme de recherche souvent inspiré par des modèles théoriques spécifiques, allant des trous noirs quantiques à la supersymétrie, les physiciens appliquent de nouvelles méthodes indépendantes des modèles pour élargir leurs recherches. ATLAS vient de publier la première recherche indépendante du modèle de nouvelles particules en utilisant une nouvelle technique appelée "supervision faible".

    Les recherches de nouvelles particules commencent généralement par un modèle théorique spécifique. Compte tenu de la phénoménologie et des paramètres du modèle, les physiciens simuleront comment de nouvelles particules seraient produites et se désintégreraient dans le détecteur ATLAS. Ils simulent ensuite les processus d'arrière-plan du modèle standard afin de développer des classificateurs (avec ou sans apprentissage automatique) qui séparent les signaux de l'arrière-plan. Ces classifieurs déterminent la meilleure région d'espace de phase des données à étudier, où un signal hypothétique devrait être enrichi. Finalement, les physiciens compareront les données et la prédiction de fond à la recherche d'anomalies.

    La nouvelle recherche d'ATLAS utilise des classificateurs d'apprentissage automatique (réseaux de neurones) développés directement sur les données afin de réduire leur dépendance à un modèle spécifique. Il s'agit d'un écart important par rapport aux méthodes standard car les données ne sont pas étiquetées :on ne sait pas si un événement particulier de collision proton-proton est un bruit de fond ou un signal. Cette méthode, connue sous le nom de « supervision faible », exploite les structures des données sans avoir besoin d'étiquettes par événement.

    Parallèlement à cette méthode, la nouvelle recherche ATLAS utilise l'une des stratégies de détection d'anomalies indépendantes de la simulation les plus traditionnelles :la « chasse aux chocs ». Le but d'une chasse aux bosses est de rechercher une « bosse » localisée au-dessus d'un fond lisse. De telles bosses sont une caractéristique générique de nombreux modèles de nouvelles particules, où la bosse se produit à la masse de la nouvelle particule. La nouvelle recherche s'appuie sur cette base solide pour améliorer la sensibilité à une grande variété de particules hypothétiques sans spécifier leurs propriétés à l'avance.

    La combinaison de la recherche de bosses et d'une supervision faible donne une analyse qui est pour la plupart exempte de dépendance entre le modèle de signal et le modèle d'arrière-plan.

    Figure 2 :La sortie du réseau de neurones dans un bac de masse dijet. En tant que fonction bidimensionnelle, la sortie peut être facilement visualisée sous forme d'image, où l'intensité correspond à l'efficacité de la sortie du réseau dans le bac de masse dijet. Le tracé de gauche n'a aucun signal injecté et le tracé de droite montre la sortie lorsqu'une particule hypothétique à 3 TeV qui se désintègre en deux autres particules à 200 GeV est ajoutée aux données. Crédit :Collaboration ATLAS/CERN

    Détecter les anomalies avec une supervision faible

    Les physiciens d'ATLAS ont formé des réseaux de neurones sur des données en utilisant une technique appelée "Classification sans étiquettes" (CWoLa, prononcé « Koala »). Dans cette approche, les physiciens construisent deux ensembles de données mixtes composés de bruit de fond et potentiellement aussi de signaux. Celles-ci sont identiques à l'exception des proportions relatives du signal potentiel. Alors que les étiquettes signal-vs-arrière-plan sont inconnues pour chaque événement, les réseaux de neurones peuvent être entraînés pour différencier les deux ensembles de données. Avec suffisamment de données et un classificateur suffisamment puissant, c'est en fait optimal pour distinguer le signal du fond.

    La méthode CWoLa est combinée à une chasse au bump lors de la création des jeux de données mixtes ci-dessus, comme le montre la figure 1. Les événements de signal seraient caractérisés par une région de résonance localisée et une région de bande latérale. Ces régions auraient d'autres caractéristiques (y) qui peuvent également être utilisées pour entraîner les réseaux de neurones. S'il n'y a pas de signal, un réseau de neurones n'apprendrait rien et s'il y a un signal, il peut apprendre à le distinguer par rapport à l'arrière-plan.

    La nouvelle recherche ATLAS est la première application de détection d'anomalies entièrement basée sur l'apprentissage automatique et basée sur les données. La recherche a examiné des événements avec des états finals hadroniques, en utilisant la masse invariante des paires de "jets" de particules comme caractéristique résonante et les masses des jets individuels comme caractéristiques pour entraîner le classificateur CWoLa. En utilisant cet ensemble restreint de fonctionnalités, les physiciens ont établi avec succès la procédure et ont découvert qu'elle est déjà sensible à un large éventail de nouvelles particules.

    Les physiciens ont pu entraîner les réseaux de neurones tout en évitant un facteur d'essais statistiques qui réduirait la sensibilité de la recherche à partir de l'entraînement et des tests sur les mêmes données. Le réseau de neurones (Figure 2) est mappé à une efficacité. Par exemple, 10 % signifie que 90 % des événements ont une sortie réseau inférieure à cette valeur. En l'absence de signal, le réseau ne devrait rien apprendre (car les deux ensembles de données mixtes devraient être les mêmes), mais il doit y avoir une région de faible efficacité par conception. Le tracé de droite de la figure 2 montre que le réseau est capable d'identifier le signal injecté, même s'il n'a pas été dit où chercher à l'avance !

    Figure 3 :Des signaux particuliers sont simulés puis ajoutés aux données afin de fixer des limites. Les modèles choisis ici représentent une particule lourde A (avec une masse de 3 TeV) se désintégrant en deux autres nouvelles particules B et C avec des masses inscrites sur l'axe horizontal. L'axe vertical est la limite - les nombres inférieurs indiquent des limites plus fortes. La nouvelle recherche est comparée à deux résultats existants d'ATLAS :la recherche inclusive de dijets (triangles rouges) et une recherche dédiée aux jets produits à partir des bosons W et Z (croix grise). Crédit :Collaboration ATLAS/CERN

    Offrir une nouvelle précision

    La nouvelle recherche n'a pas abouti à des preuves significatives de nouvelles particules et quantifier ce qui n'a pas été trouvé était son propre défi. D'habitude, les physiciens peuvent simplement demander combien de signal il faudrait ajouter pour enregistrer un excès significatif, puis cette quantité de signal est déclarée exclue car aucun excès n'a été observé. Pour obtenir des exclusions similaires pour cette analyse, tous les réseaux de neurones devaient être réformés pour chaque type de signal et quantité de signal modélisés.

    Les limites résultantes sont présentées dans la figure 3. La production de ce tracé a nécessité une formation d'environ 20, 000 réseaux de neurones ! Certains signaux étaient plus difficiles à trouver pour les réseaux de neurones que d'autres, avec ceux dans les régions avec beaucoup d'antécédents s'avérant particulièrement difficile. Pour les autres signaux, les nouvelles limites sont plus fortes que les limites précédentes et améliorent les recherches précédentes dans un espace de phase similaire.

    Regarder vers l'avenir

    Cette nouvelle approche adoptée par ATLAS offre de nombreuses possibilités d'extensions. La chasse aux bosses faiblement supervisée pourrait être appliquée à des topologies d'événements supplémentaires et davantage de fonctionnalités pourraient être ajoutées pour élargir la sensibilité aux nouvelles particules. Des réseaux de neurones plus complexes peuvent être nécessaires pour s'adapter aux espaces de caractéristiques de plus grande dimension, ce qui nécessitera des ressources de calcul exigeantes. Les physiciens d'ATLAS envisagent également une variété de techniques alternatives de détection d'anomalies, qui peut être en mesure de compléter la recherche basée sur CWoLa. Il est probable qu'aucune méthode ne couvrira tout - plusieurs approches seront nécessaires pour assurer robuste, et une forte sensibilité aux nouvelles particules.


    © Science https://fr.scienceaq.com