Crédit :Pixabay/CC0 Domaine public
Cela fait près d'un siècle que l'astronome Fritz Zwicky a calculé pour la première fois la masse de l'amas de Coma, un ensemble dense de près de 1 000 galaxies situées dans l'univers proche. Mais estimer la masse de quelque chose d'aussi énorme et dense, sans parler de 320 millions d'années-lumière, a son lot de problèmes - hier et aujourd'hui. Les mesures initiales de Zwicky, et les nombreuses mesures effectuées depuis, sont en proie à des sources d'erreur qui biaisent la masse vers le haut ou vers le bas.
Maintenant, à l'aide d'outils d'apprentissage automatique, une équipe dirigée par des physiciens de l'Université Carnegie Mellon a développé une méthode d'apprentissage en profondeur qui estime avec précision la masse du cluster Coma et atténue efficacement les sources d'erreur.
"Les gens ont fait des estimations de masse du Coma Cluster pendant de très nombreuses années. Mais en montrant que nos méthodes d'apprentissage automatique sont cohérentes avec ces estimations de masse précédentes, nous renforçons la confiance dans ces nouvelles méthodes très puissantes qui font fureur dans le domaine. de la cosmologie en ce moment », a déclaré Matthew Ho, étudiant diplômé de cinquième année au McWilliams Center for Cosmology du Département de physique et membre du NSF AI Planning Institute for Physics of the Future de Carnegie Mellon.
Les méthodes d'apprentissage automatique sont utilisées avec succès dans divers domaines pour trouver des modèles dans des données complexes, mais elles n'ont pris pied dans la recherche en cosmologie qu'au cours de la dernière décennie. Pour certains chercheurs dans le domaine, ces méthodes s'accompagnent d'une préoccupation majeure :étant donné qu'il est difficile de comprendre le fonctionnement interne d'un modèle d'apprentissage automatique complexe, peut-on leur faire confiance pour faire ce pour quoi elles sont conçues ? Ho et ses collègues ont entrepris de répondre à ces réserves avec leurs dernières recherches, publiées dans Nature Astronomy .
Pour calculer la masse de l'amas de coma, Zwicky et d'autres ont utilisé une mesure de masse dynamique, dans laquelle ils ont étudié le mouvement ou la vitesse d'objets en orbite dans et autour de l'amas, puis ont utilisé leur compréhension de la gravité pour déduire la masse de l'amas. Mais cette mesure est sujette à diverses erreurs. Les amas de galaxies existent en tant que nœuds dans un immense réseau de matière réparti dans tout l'univers, et ils entrent constamment en collision et fusionnent les uns avec les autres, ce qui déforme le profil de vitesse des galaxies constituantes. Et parce que les astronomes observent l'amas à grande distance, il y a beaucoup d'autres choses entre les deux qui peuvent ressembler et agir comme si elles faisaient partie de l'amas de galaxies, ce qui peut biaiser la mesure de masse. Des recherches récentes ont fait des progrès vers la quantification et la prise en compte de l'effet de ces erreurs, mais les méthodes basées sur l'apprentissage automatique offrent une approche innovante basée sur les données, selon Ho.
"Notre méthode d'apprentissage en profondeur apprend à partir de données réelles quelles sont les mesures utiles et ce qui ne le sont pas", a déclaré Ho, ajoutant que leur méthode élimine les erreurs des galaxies interlopes (effets de sélection) et tient compte de diverses formes de galaxies (effets physiques). "L'utilisation de ces méthodes basées sur les données rend nos prédictions meilleures et automatisées."
"L'une des principales lacunes des approches standard d'apprentissage automatique est qu'elles donnent généralement des résultats sans aucune incertitude", a ajouté le professeur agrégé de physique Hy Trac, conseiller de Ho. "Notre méthode comprend des statistiques bayésiennes robustes, qui nous permettent de quantifier l'incertitude de nos résultats."
Ho et ses collègues ont développé leur nouvelle méthode en personnalisant un outil d'apprentissage automatique bien connu appelé réseau neuronal convolutif, qui est un type d'algorithme d'apprentissage en profondeur utilisé dans la reconnaissance d'images. Les chercheurs ont entraîné leur modèle en lui alimentant des données issues de simulations cosmologiques de l'univers. Le modèle a appris en examinant les caractéristiques observables de milliers d'amas de galaxies, dont la masse est déjà connue. Après une analyse approfondie de la gestion par le modèle des données de simulation, Ho l'a appliqué à un système réel - le Coma Cluster - dont la masse réelle n'est pas connue. La méthode de Ho a calculé une estimation de masse qui est cohérente avec la plupart des estimations de masse faites depuis les années 1980. C'est la première fois que cette méthodologie spécifique d'apprentissage automatique est appliquée à un système d'observation.
"Pour renforcer la fiabilité des modèles d'apprentissage automatique, il est important de valider les prédictions du modèle sur des systèmes bien étudiés, comme Coma", a déclaré Ho. "Nous entreprenons actuellement une vérification plus rigoureuse et plus approfondie de notre méthode. Les résultats prometteurs sont une étape importante vers l'application de notre méthode sur de nouvelles données non étudiées."
Des modèles comme ceux-ci vont être essentiels pour aller de l'avant, en particulier lorsque des relevés spectroscopiques à grande échelle, tels que l'instrument spectroscopique à énergie noire, l'observatoire Vera C. Rubin et Euclid, commencent à publier les grandes quantités de données qu'ils collectent sur le ciel. .
"Bientôt, nous aurons un flux de données à l'échelle du pétaoctet", a expliqué Ho. "C'est énorme. Il est impossible pour les humains d'analyser cela à la main. Alors que nous travaillons sur la construction de modèles qui peuvent être des estimateurs robustes de choses comme la masse tout en atténuant les sources d'erreur, un autre aspect important est qu'ils doivent être efficaces en termes de calcul si nous sommes va traiter cet énorme flux de données provenant de ces nouvelles enquêtes. Et c'est exactement ce que nous essayons d'aborder :utiliser l'apprentissage automatique pour améliorer nos analyses et les rendre plus rapides. » La plus grande suite de simulations cosmiques pour la formation à l'IA, téléchargeable gratuitement, stimule déjà les découvertes