• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Les cosmologistes du laboratoire de Berkeley sont les principaux candidats au défi de l'apprentissage automatique

    Logo des Jeux olympiques du LHC 2020. Crédit :Gregor Kasieczka, Benjamin Nachman, David Shih

    A la recherche de nouvelles particules, les physiciens peuvent s'appuyer sur des prédictions théoriques qui suggèrent de bons endroits où chercher et de bonnes façons de les trouver :c'est comme si on leur remettait un croquis approximatif d'une aiguille cachée dans une botte de foin.

    Mais les recherches à l'aveugle sont beaucoup plus compliquées, comme chasser dans une botte de foin sans savoir ce que vous cherchez.

    Pour découvrir ce que les algorithmes informatiques conventionnels et les scientifiques peuvent négliger dans l'énorme volume de données collectées dans les expériences de collisionneur de particules, la communauté de la physique des particules se tourne vers le machine learning, une application de l'intelligence artificielle qui peut apprendre d'elle-même à améliorer ses compétences de recherche en passant au crible une botte de foin de données.

    Dans un défi d'apprentissage automatique baptisé les Jeux olympiques 2020 du grand collisionneur de hadrons (LHC), une équipe de cosmologistes du Lawrence Berkeley National Laboratory (Berkeley Lab) du département américain de l'Énergie a développé un code qui a mieux identifié un signal fictif caché dans des données de collision de particules simulées.

    Cosmologues ? C'est exact.

    "C'était totalement inattendu pour nous de jouer si bien, " dit George Stein, un chercheur postdoctoral Berkeley Lab et UC Berkeley qui a participé au challenge avec Uros Seljak, un cosmologiste de Berkeley Lab, professeur à l'UC Berkeley, et co-directeur du Berkeley Center for Cosmological Physics, dont Stein est membre.

    Dix équipes, composé principalement de physiciens des particules, participé à la compétition, qui s'est déroulé du 19 novembre, 2019, au 12 janvier, 2020.

    Stein a dirigé l'adaptation d'un code que deux autres étudiants chercheurs avaient développé sous la direction de Seljak. Le concours a été lancé par les organisateurs de la conférence Machine Learning for Jets 2020 (ML4Jets2020). Les jets sont des cônes étroits de particules produites lors d'expériences de collision de particules que les physiciens des particules peuvent retracer pour mesurer les propriétés de leurs sources de particules.

    Les résultats du concours ont été annoncés lors de la conférence, qui a eu lieu à l'Université de New York du 15 au 17 janvier.

    Ben Nachman, un chercheur postdoctoral du Berkeley Lab qui fait partie d'un groupe qui travaille sur ATLAS, un grand détecteur du LHC du CERN, a été l'un des organisateurs de l'événement et du concours. David Shih, professeur de physique et d'astronomie à l'Université Rutgers, actuellement en congé sabbatique au Berkeley Lab, et Gregor Kasieczka, professeur à l'Université de Hambourg en Allemagne, étaient co-organisateurs.

    Alors que certains concours informatiques permettent aux participants de soumettre et de tester leurs codes plusieurs fois pour évaluer s'ils se rapprochent des bons résultats, la compétition des Jeux olympiques du LHC 2020 n'a donné aux équipes qu'une seule chance de soumettre une solution.

    "Ce qui est cool, c'est que nous n'avons pas utilisé d'outil standard, " a déclaré Seljak. "Nous avons utilisé un outil que nous avions développé pour nos recherches."

    Il a noté, "Dans mon groupe, nous travaillions sur l'apprentissage automatique non supervisé. L'idée est que vous vouliez décrire des données là où les données n'ont pas d'étiquettes."

    L'outil utilisé par l'équipe s'appelle le transport optimal itératif tranché. "C'est une forme d'apprentissage en profondeur, mais une forme où l'on n'optimise pas tout d'un coup, " dit Seljak. " Au lieu de cela, nous le faisons de manière itérative, " dans stages.

    Le code est si efficace qu'il peut s'exécuter sur un simple ordinateur de bureau ou portable. Il a été développé pour une approche statistique connue sous le nom de preuve bayésienne.

    Seljak a dit, "Supposons que vous regardiez des anomalies dans le temps de transit d'une planète, " le temps qu'il faut à la planète pour passer devant un objet plus gros de votre point de vue, comme regarder depuis la Terre pendant que Mercure se déplace devant le soleil.

    "Une solution nécessite qu'il y ait une planète supplémentaire, " il a dit, "et l'autre solution nécessite une lune supplémentaire, et ils sont tous les deux bien adaptés aux données, mais ils ont des paramètres très différents. Comment comparer ces deux solutions ?"

    L'approche bayésienne consiste à calculer les preuves pour les deux solutions et à voir quelle solution a la plus grande probabilité d'être vraie.

    "Ce genre d'exemple revient tout le temps, " Seljak a dit, et le code de son équipe est conçu pour accélérer les calculs complexes requis par les méthodes conventionnelles. "Nous essayions d'améliorer quelque chose sans rapport avec la physique des particules, et nous avons réalisé que cela pouvait être utilisé comme un outil général d'apprentissage automatique."

    Il ajouta, "Notre solution est particulièrement utile pour ce qu'on appelle la détection d'anomalies :à la recherche de très petits signaux dans des données qui sont en quelque sorte différentes de ses autres données."

    Dans la compétition des Jeux olympiques du LHC 2020, les participants ont d'abord reçu un échantillon de données qui appelaient des données de signaux de particules à partir de certaines données de base - à la fois l'aiguille et la botte de foin - qui ont permis aux participants de tester leurs codes.

    Ensuite, ils ont reçu les données réelles du concours "boîte noire":juste la botte de foin. Ils ont été chargés de trouver un type de signal de particule différent et entièrement inconnu caché dans les données de fond, et pour décrire spécifiquement les événements de signal que leurs méthodes ont révélés.

    Les co-organisateurs du concours, Shih et Nachman, ont indiqué qu'ils avaient personnellement travaillé sur une méthode de détection d'anomalies qui utilise une approche très similaire (appelée « estimation de densité conditionnelle ») à la technique développée par Seljak et Stein qui a été inscrite au concours.

    Seljak et Stein ont consulté un certain nombre de physiciens des particules au laboratoire, dont Nachman, Shih, et l'étudiant diplômé Patrick McCormack. Ils ont discuté, entre autres sujets, comment la communauté de la physique des hautes énergies analyse généralement des ensembles de données comme ceux utilisés dans la compétition, mais pour le véritable défi de la "boîte noire", Seljak et Stein étaient seuls.

    Alors que le concours touchait à sa fin, Stein a dit, "Nous pensions avoir trouvé quelque chose environ une semaine avant la date limite."

    Stein et Seljak ont ​​remis leurs résultats quelques jours avant la conférence, "mais comme nous ne sommes pas des physiciens des particules, nous n'avions pas prévu de participer à la conférence, " dit Seljak.

    Puis, Stein a reçu un e-mail des organisateurs de la conférence, qui lui a demandé de s'envoler et de présenter une conférence sur la solution de l'équipe plus tard dans la semaine. Les organisateurs n'ont partagé les résultats du concours qu'une fois que tous les intervenants ont présenté leurs résultats.

    "Mon discours était à l'origine d'abord, et puis peu de temps avant le début de la session, ils m'ont déplacé pour durer. Je ne savais pas si c'était une bonne chose, ", a déclaré Stein.

    Le code que l'équipe de Berkeley Lab a saisi a récupéré environ 1, 000 événements, avec une marge d'erreur de plus ou moins 200, et la réponse correcte était de 843 événements. Leur code était clairement le gagnant dans cette catégorie.

    Plusieurs équipes étaient proches dans l'estimation du niveau d'énergie, ou "masse de résonance, " du signal, et l'équipe de Berkeley Lab était la plus proche dans son estimation de la masse de résonance pour un signal secondaire provenant du signal principal.

    À la conférence, Stein a noté, « L'approche globale que nous avons adoptée a suscité un grand intérêt. Elle a fait des vagues. »

    Oz Amram, un autre concurrent au concours, plaisanté dans un post Twitter, "Le résultat des Jeux olympiques du LHC... est que les cosmologistes sont meilleurs que nous dans notre travail." Mais les organisateurs du concours n'ont pas officiellement annoncé de gagnant.

    Nachman, l'un des organisateurs de l'événement, mentionné, "Même si George et Uros ont clairement surpassé les autres concurrents, en fin de compte, il est probable qu'aucun algorithme ne couvrira toutes les possibilités, nous aurons donc besoin d'un ensemble diversifié d'approches pour atteindre une large sensibilité. »

    Il ajouta, "La physique des particules est entrée dans une période intéressante où chaque prédiction de nouvelles particules que nous avons testées au Grand collisionneur de hadrons s'est jusqu'à présent avérée non réalisée dans la nature, à l'exception du modèle standard de physique des particules. Bien qu'il soit essentiel de poursuivre le programme des recherches basées sur les modèles, nous devons également développer un programme parallèle pour être indépendant des modèles. C'est la motivation de ce challenge."

    Seljak a déclaré que son équipe prévoyait de publier un article détaillant son code d'apprentissage automatique.

    "Nous prévoyons certainement d'appliquer cela à de nombreux problèmes d'astrophysique, " a-t-il dit. " Nous chercherons des applications intéressantes - tout ce qui a des problèmes ou des transitoires, quoi que ce soit d'anormal. Nous allons travailler pour accélérer le code et le rendre plus puissant. Ce genre d'approches peut vraiment aider. »


    © Science https://fr.scienceaq.com