Les mondes en orbite autour d'étoiles autres que notre soleil sont des « exoplanètes, ” et ils existent en plusieurs tailles, des géantes gazeuses plus grandes que Jupiter aux petites, planètes rocheuses. Cette illustration d'une "super-Terre" représente le type de planète que la mission TESS vise à trouver en dehors de notre système solaire. Crédit :M. Kornmesser/ESO
Lorsque le MIT a lancé le MIT Stephen A. Schwarzman College of Computing cet automne, l'un des objectifs était de stimuler davantage l'innovation informatique dans toutes les écoles du MIT. Les chercheurs vont déjà au-delà des applications traditionnelles de l'informatique et utilisent ces techniques pour faire progresser un éventail de domaines scientifiques, de la médecine du cancer à l'anthropologie en passant par le design et la découverte de nouvelles planètes.
Le calcul s'est déjà avéré utile pour le Transiting Exoplanet Survey Satellite (TESS), une mission financée par la NASA et dirigée par le MIT. Lancé de Cap Canaveral en avril 2018, TESS est un satellite qui prend des images du ciel en orbite autour de la Terre. Ces images peuvent aider les chercheurs à trouver des planètes en orbite autour d'étoiles au-delà de notre soleil, appelées exoplanètes. Ce travail, qui est maintenant à mi-chemin, en révélera plus sur les autres planètes de ce que la NASA appelle notre « voisinage solaire ».
"TESS vient de terminer la première de sa mission principale de deux ans, scrutant le ciel nocturne austral, " dit Sara Seager, astrophysicien et planétologue au MIT et directeur scientifique adjoint du TESS. "TESS trouvé sur 1, 000 planètes candidates et une vingtaine de planètes confirmées, certains dans des systèmes à plusieurs planètes."
Alors que TESS a permis jusqu'à présent des découvertes impressionnantes, trouver ces exoplanètes n'est pas une tâche simple. TESS collecte des images de plus de 200, 000 étoiles lointaines, enregistrer une image de ces planètes toutes les deux minutes, ainsi que l'enregistrement d'une image d'une large bande de ciel toutes les 30 minutes. Seager dit toutes les deux semaines, c'est le temps qu'il faut au satellite pour orbiter autour de la Terre, TESS envoie environ 350 gigaoctets de données (une fois non compressées) vers la Terre. Alors que Seager dit que ce ne sont pas autant de données que les gens pourraient s'y attendre (un Macbook Pro 2019 a jusqu'à 512 gigaoctets de stockage), l'analyse des données implique la prise en compte de nombreux facteurs complexes.
Seager, qui dit qu'elle s'intéresse depuis longtemps à la façon dont le calcul peut être utilisé comme un outil pour la science, a commencé à discuter du projet avec Victor Pankratius, ancien chercheur principal à l'Institut Kavli d'astrophysique et de recherche spatiale du MIT, qui est maintenant directeur et responsable de l'ingénierie logicielle mondiale chez Bosch Sensortec. Informaticien de formation, Pankratius dit qu'après son arrivée au MIT en 2013, il a commencé à réfléchir aux domaines scientifiques qui produisent des mégadonnées, mais qui n'ont pas encore pleinement profité des techniques informatiques. Après avoir parlé avec des astronomes comme Seager, il en a appris davantage sur les données recueillies par leurs instruments et s'est intéressé à l'application de techniques de découverte assistée par ordinateur à la recherche d'exoplanètes.
"L'univers est un grand endroit, ", dit Pankratius. "Je pense donc que tirer parti de ce que nous avons du côté de l'informatique est une bonne chose."
L'idée de base qui sous-tend la mission de TESS est que, comme notre propre système solaire, dans laquelle la Terre et d'autres planètes tournent autour d'une étoile centrale (le soleil), il y a d'autres planètes au-delà de notre système solaire tournant autour d'étoiles différentes. Les images que TESS collecte produisent des courbes lumineuses, des données qui montrent comment la luminosité de l'étoile change au fil du temps. Les chercheurs analysent ces courbes de lumière pour trouver des baisses de luminosité, ce qui pourrait indiquer qu'une planète passe devant l'étoile et bloque temporairement une partie de sa lumière.
"Chaque fois qu'une planète tourne en orbite, tu verrais cette luminosité baisser, " Pankratius dit. "C'est presque comme un battement de coeur."
Le problème est que chaque baisse de luminosité n'est pas nécessairement causée par le passage d'une planète. Seager dit que l'apprentissage automatique entre actuellement en jeu pendant la phase de "triage" de leur analyse de données TESS, en les aidant à faire la distinction entre les planètes potentielles et d'autres choses qui pourraient provoquer des baisses de luminosité, comme des étoiles variables, qui varient naturellement dans leur éclat, ou le bruit des instruments.
L'analyse sur les planètes qui passent par le triage est toujours effectuée par des scientifiques qui ont appris à "lire" les courbes de lumière. Mais l'équipe utilise maintenant des milliers de courbes de lumière qui ont été classées à l'œil nu pour enseigner aux réseaux de neurones comment identifier les transits d'exoplanètes. Le calcul les aide à affiner les courbes de lumière qu'ils doivent examiner plus en détail. Liang Yu Ph.D. '19, un jeune diplômé en physique, construit sur un code existant pour écrire l'outil d'apprentissage automatique que l'équipe utilise maintenant.
Bien qu'utile pour se concentrer sur les données les plus pertinentes, Seager dit que l'apprentissage automatique ne peut pas encore être utilisé pour simplement trouver des exoplanètes. "Nous avons encore beaucoup de travail à faire, " elle dit.
Pankratius est d'accord. "Ce que nous voulons faire, c'est créer des systèmes de découverte assistés par ordinateur qui le font pour toutes [les étoiles] tout le temps, " dit-il. " Vous voulez juste appuyer sur un bouton et dire, montre moi tout. Mais pour le moment, ce sont toujours des gens avec une certaine automatisation qui vérifient toutes ces courbes de lumière. »
Seager et Pankratius ont également co-enseigné un cours axé sur divers aspects du développement du calcul et de l'intelligence artificielle (IA) en science planétaire. Seager dit que l'inspiration pour le cours est née d'un intérêt croissant des étudiants à en savoir plus sur l'IA et ses applications à la science des données de pointe.
En 2018, le cours a permis aux étudiants d'utiliser des données réelles collectées par TESS pour explorer des applications d'apprentissage automatique pour ces données. Inspiré d'un autre cours enseigné par Seager et Pankratius, les étudiants du cours ont pu choisir un problème scientifique et acquérir les compétences en calcul pour résoudre ce problème. Dans ce cas, les étudiants ont appris les techniques d'IA et les applications à TESS. Seager dit que les étudiants ont eu une excellente réponse à la classe unique.
"En tant qu'étudiant, tu pourrais faire une découverte, " dit Pankratius. " Vous pouvez créer un algorithme d'apprentissage automatique, l'exécuter sur ces données, et qui sait, peut-être trouverez-vous quelque chose de nouveau."
Une grande partie des données collectées par TESS sont également facilement disponibles dans le cadre d'un projet de science citoyenne plus vaste. Pankratius dit que n'importe qui avec les bons outils pourrait commencer à faire ses propres découvertes. Grâce à la connectivité cloud, c'est même possible sur un téléphone portable.
"Si vous vous ennuyez en rentrant chez vous en bus, pourquoi ne pas chercher des planètes?", dit-il.
Pankratius dit que ce type de travail collaboratif permet aux experts de chaque domaine de partager leurs connaissances et d'apprendre les uns des autres, plutôt que d'essayer de se laisser entraîner dans le champ de l'autre.
"Heures supplémentaires, la science est devenue plus spécialisée, nous avons donc besoin de moyens pour mieux intégrer les spécialistes, " dit Pankratius. Le collège d'informatique pourrait aider à forger plus de telles collaborations, il ajoute. Pankratius dit également qu'il pourrait attirer des chercheurs qui travaillent à l'intersection de ces disciplines, qui peut combler les écarts de compréhension entre les experts.
Ce type de travail intégrant l'informatique est déjà de plus en plus répandu dans tous les domaines scientifiques, Remarques de Seager. « L'apprentissage automatique est « en vogue » en ce moment, " elle dit.
Pankratius dit que c'est en partie parce qu'il existe de plus en plus de preuves que l'exploitation des techniques informatiques est un moyen efficace de résoudre divers types de problèmes et d'ensembles de données croissants.
"Nous avons maintenant des démonstrations dans différents domaines que l'approche de découverte assistée par ordinateur ne fonctionne pas seulement, ", dit Pankratius. "Cela conduit en fait à de nouvelles découvertes."