Un diagramme montrant une vue d'ensemble de haut niveau de l'architecture du modèle Deep-CEE. Ce nouvel outil d'apprentissage en profondeur a été conçu pour aider à trouver des amas de galaxies. Crédits :M. C. Chan et J. P. Stott, MNRAS soumis et basé sur Ren et al. 2015
Les amas de galaxies sont parmi les structures les plus massives du cosmos, mais malgré des millions d'années-lumière de diamètre, ils peuvent encore être difficiles à repérer. Des chercheurs de l'Université de Lancaster se sont tournés vers l'intelligence artificielle pour obtenir de l'aide, développer "Deep-CEE" (Deep Learning for Galaxy Cluster Extraction and Evaluation), une nouvelle technique d'apprentissage en profondeur pour accélérer le processus de recherche. Matthieu Chan, un doctorat étudiant à l'université de Lancaster, présente ce travail lors de la réunion nationale d'astronomie de la Royal Astronomical Society le 4 juillet à 15h45 dans le cadre de la session Machine Learning in Astrophysics.
La plupart des galaxies de l'univers vivent dans des environnements à faible densité appelés "le champ", ou en petits groupes, comme celui qui contient notre Voie Lactée et Andromède. Les amas de galaxies sont plus rares, mais ils représentent les environnements les plus extrêmes dans lesquels les galaxies peuvent vivre et les étudier peut nous aider à mieux comprendre la matière noire et l'énergie noire.
Au cours des années 1950, le pionnier de la recherche d'amas de galaxies, l'astronome George Abell, passé de nombreuses années à rechercher des amas de galaxies à l'œil nu, à l'aide d'une loupe et de plaques photographiques pour les localiser. Abell analysé manuellement autour de 2, 000 plaques photographiques, à la recherche de signatures visuelles des amas de galaxies, et détaillant les coordonnées astronomiques des régions denses des galaxies. Ses travaux ont abouti au « catalogue Abell » des amas de galaxies trouvés dans l'hémisphère nord.
Deep-CEE s'appuie sur l'approche d'Abell pour identifier les amas de galaxies, mais remplace l'astronome par un modèle d'IA qui a été formé pour « regarder » les images en couleur et identifier les amas de galaxies. C'est un modèle de pointe basé sur des réseaux de neurones, qui sont conçus pour imiter la façon dont un cerveau humain apprend à reconnaître des objets en activant des neurones spécifiques lors de la visualisation de motifs et de couleurs distinctifs.
Chan a entraîné l'IA en lui montrant à plusieurs reprises des exemples connus, étiqueté, objets dans les images jusqu'à ce que l'algorithme soit capable d'apprendre à associer des objets par lui-même. Ensuite, une étude pilote a été menée pour tester la capacité de l'algorithme à identifier et à classer les amas de galaxies dans des images contenant de nombreux autres objets astronomiques.
Image montrant l'amas de galaxies Abell1689. Le nouvel outil d'apprentissage en profondeur Deep-CEE a été développé pour accélérer le processus de recherche d'amas de galaxies comme celui-ci, et s'inspire dans son approche du pionnier de la découverte d'amas de galaxies, Georges Abell, qui a fouillé manuellement des milliers de plaques photographiques dans les années 1950. Crédit :NASA/ESA
"Nous avons appliqué avec succès Deep-CEE au Sloan Digital Sky Survey", déclare Chan, "finalement, nous exécuterons notre modèle sur des levés révolutionnaires tels que le télescope Large Synoptic Survey (LSST) qui sondera plus large et plus profondément dans des régions de l'Univers jamais explorées auparavant.
De nouveaux télescopes à la pointe de la technologie ont permis aux astronomes d'observer plus large et plus profondément que jamais auparavant, comme l'étude de la structure à grande échelle de l'univers et la cartographie de son vaste contenu non découvert.
En automatisant le processus de découverte, les scientifiques peuvent numériser rapidement des ensembles d'images, et renvoyer des prédictions précises avec une interaction humaine minimale. Cela sera essentiel pour l'analyse des données à l'avenir. Le prochain relevé du ciel du LSST (qui devrait être mis en ligne en 2021) représentera le ciel de l'ensemble de l'hémisphère sud, générant environ 15 To de données chaque nuit.
"Les techniques d'exploration de données telles que l'apprentissage en profondeur nous aideront à analyser les énormes résultats des télescopes modernes", déclare le Dr John Stott (directeur de doctorat de Chan). "Nous nous attendons à ce que notre méthode trouve des milliers de clusters jamais vus auparavant par la science".
Chan présentera les résultats de son article "Fishing for galaxy clusters with "Deep-CEE" neural nets" le 4 juillet à 15h45 dans le cadre de la session "Machine Learning in Astrophysics". (Chan et Stott 2019) qui a été soumis à MNRAS et se trouve sur Arxiv .