Cette illustration représente les courbes de lumière pour un binaire à éclipse représentatif (en haut) et l'un des systèmes d'étoiles quadruples à éclipse candidats identifiés par Adam Friedman. Les creux supplémentaires causés par des éclipses supplémentaires dans le système quadruple entraînent un schéma plus compliqué. Crédit :Goddard Space Flight Center de la NASA
Une partie d'échecs a 20 coups d'ouverture possibles. Imaginez qu'on vous demande de commencer un jeu avec des dizaines de millions d'ouvertures à la place. C'était la tâche assignée à Adam Friedman, un stagiaire d'été 2020 au Goddard Space Flight Center de la NASA à Greenbelt, Maryland. Un champion d'échecs au lycée, Friedman a analysé son adversaire, un déluge de données sur les changements de luminosité de plus de 70 millions d'étoiles.
En utilisant des approches informatiques traditionnelles, la tâche de passer au crible et de classer ces mesures aurait pu prendre des mois. Avec l'utilisation de l'apprentissage automatique, une forme d'intelligence artificielle, cela peut être accompli en quelques secondes. En collaboration avec Brian Powell, un data scientist au High Energy Astrophysics Science Archive Research Center à Goddard, Friedman a entraîné un système informatique à identifier une classe importante d'étoiles variables sans le programmer explicitement pour le faire.
L'apprentissage automatique permet aux ordinateurs de traiter et de trier automatiquement d'immenses quantités de données, exactement ce qu'il fallait pour passer au crible le torrent de données stellaires. Pour faire ça, Powell a créé un réseau de neurones - une série de règles mathématiques qui tentent de reconnaître les relations sous-jacentes dans les données grâce à un processus qui imite, d'une manière très simplifiée, comment fonctionne le cerveau humain. Pour qu'un réseau de neurones fonctionne, bien que, il doit être formé.
"Le stage consistait à collecter des données de formation, " Friedman a dit, « parce que l'apprentissage automatique fonctionne en collectant un nombre incroyablement élevé d'exemples pour entraîner le modèle. »
Le satellite Transiting Exoplanet Survey (TESS) de la NASA lancé en avril 2018 pour découvrir de nouveaux mondes au-delà de notre système solaire, ou exoplanètes, en surveillant les changements de luminosité dans les étoiles proches. Depuis son lancement, TESS a observé presque tout le ciel. Bihebdomadaire, le satellite renvoie plusieurs milliers de grandes images appelées images plein format d'une section pré-planifiée du ciel.
Les astronomes utilisent les données pour construire des courbes de lumière, graphiques qui montrent comment la luminosité d'une étoile change au fil du temps. A partir des données TESS brutes, Powell a utilisé le 129, 000-core Découvrez le supercalculateur au Center for Climate Simulation (NCCS) de la NASA à Goddard pour créer des millions de courbes de lumière.
"Grâce au soutien du NCCS, nous avons pu commencer à construire des courbes de lumière en quantités massives. Nous en avons environ 70 millions maintenant, avec plus en route. La science des données et l'apprentissage automatique peuvent aider à conduire ces découvertes, permettant de trier et de traiter de gros volumes de données plus rapidement et avec plus de précision que jamais auparavant, " a déclaré Powell.
De cette énorme pile, Friedman voulait identifier les binaires à éclipse, des paires d'étoiles qui passent alternativement devant, ou transiter, les uns les autres sur chaque orbite vue de la Terre. Lors de chaque éclipse, le système s'estompe lorsqu'une étoile passe devant l'autre, qui produit un creux dans sa courbe de lumière. "La fonctionnalité vraiment utile d'éclipser les binaires, et la raison pour laquelle ils sont l'épine dorsale de l'astrophysique, c'est qu'ils nous donnent des mesures directes de leurs propriétés fondamentales, tels que leur masse et leur taille, " a déclaré Veselin Kostov, chercheur à Goddard et au SETI Institute de Mountain View, Californie. « Et à travers ces propriétés, nous pouvons mesurer directement les distances à ces systèmes. Ils nous offrent l'une des très rares occasions de mesurer des distances directes dans l'univers."
Le NCCS a également fourni son cluster d'unités de traitement graphique de plate-forme d'analyse de données avancées pour faire fonctionner le réseau de neurones que Powell a codé et formé par Friedman.
Friedman pourrait saisir une courbe de lumière et demander au réseau de neurones de l'attribuer à une catégorie particulière. Après avoir répété cette action des milliers de fois, le réseau de neurones a commencé à reconnaître des groupes de courbes de lumière et à suggérer des classifications basées sur la probabilité qu'une courbe donnée s'insère dans un groupe donné. Friedman a trouvé des exemples de courbes de lumière pour une large gamme de systèmes stellaires et les a saisies jusqu'à ce que le réseau apprenne à quoi ressemblait chacun et puisse identifier de nouvelles courbes de lumière de manière autonome. Cela a permis d'accomplir en quelques secondes une tâche qui aurait pris des mois sur un ordinateur de bureau moderne.
L'apprentissage automatique améliore considérablement l'efficacité de la recherche de ces systèmes stellaires dans des dizaines de millions d'images TESS en apprenant à identifier les caractéristiques d'une éclipse et en étiquetant la courbe de lumière en conséquence. Mais Friedman a rapidement remarqué une bizarrerie dans certaines des courbes de lumière que le réseau avait prétendues éclipser les candidats binaires. Ils avaient des trempettes supplémentaires.
Parfois, les systèmes stellaires peuvent avoir plus de deux composants. Si ces étoiles s'éclipsent, alors la courbe de lumière aura des gradations supplémentaires qui, à première vue, apparaîtra à intervalles irréguliers. Friedman a découvert qu'ils étaient candidats pour les systèmes multi-étoiles et a ensuite commencé une recherche exhaustive de systèmes similaires parmi les binaires à éclipse identifiés par le réseau de neurones. Au total, Friedman a trouvé huit nouveaux systèmes d'étoiles quadruples candidats. Ces cas sont intéressants car ils donnent un aperçu de la formation et de l'évolution des systèmes multi-étoiles.
Friedman venait de terminer sa première année d'études en informatique à l'Université du Michigan, et, au début de l'été, n'avait aucune formation en astronomie, calcul haute performance, science des données, ou l'apprentissage automatique. Aggravant la complexité de la tâche à accomplir, Friedman a effectué son stage à domicile en raison de COVID-19, mais malgré ces défis, Powell a dit qu'il a compris rapidement.
"Il est tout simplement brillant, " a déclaré Powell. " Adam a une capacité étrange à voir les écarts de périodicité dans les courbes de lumière. " Avec un résultat si cosmiquement profond de son stage, il est facile d'oublier le cours des progrès de Friedman. "Ce n'est pas comme s'il était astronome et expert en apprentissage automatique au début de l'été, " a-t-il ajouté. " Sa capacité à maîtriser des concepts et des compétences extrêmement complexes en si peu de temps est stupéfiante. "
Friedman était reconnaissant d'avoir passé du temps avec Powell pendant l'été. Il a déclaré:"Je dois donner un immense crédit à Brian. C'était un mentor incroyable; il était certainement le meilleur superviseur que j'aie jamais rencontré. Il me rencontrait tous les jours, juste pour m'apprendre comment faire le projet. C'était vraiment un excellent professeur."