Crédit :domaine public CC0
L'apprentissage automatique a fait irruption sur la scène au cours des deux dernières décennies et sera une technologie déterminante de l'avenir. Il transforme de vastes secteurs de la société, notamment les soins de santé, l'éducation, les transports et la production alimentaire et industrielle, tout en ayant un impact énorme sur la science et la recherche.
Sous-ensemble de l'intelligence artificielle, l'apprentissage automatique est un processus qui aide les ordinateurs à apprendre sans instruction directe et à partir de l'expérience. Pour ce faire, il utilise des algorithmes pour identifier des modèles dans les données, qui sont ensuite utilisés pour créer des modèles capables de faire des prédictions. Et les données sont la clé. L'apprentissage automatique et la disponibilité croissante de grandes quantités de données promettent de révolutionner la production de connaissances. En effet, le cycle exponentiel et vertueux de croissance actuel de l'apprentissage en profondeur, entre autres technologies, a été comparé à l'explosion cambrienne d'il y a un demi-milliard d'années, lorsque la vie sur Terre a connu une courte période de diversification très rapide.
Le professeur James Larus, doyen de la Faculté des sciences informatiques et de la communication (IC) de l'EPFL, convient que l'apprentissage automatique et l'IA auront un impact profond sur notre mode de vie et nous n'avons pas encore vu son plein potentiel.
"Pour moi, l'apprentissage automatique est un outil très puissant qui en est encore à ses balbutiements et c'est encore un peu un" art sombre ". Nous enseignons des cours d'apprentissage automatique, les mathématiques sous-jacentes et sommes capables de donner des exemples aux étudiants. quant à la façon dont cela a été appliqué dans le passé, mais nous ne pouvons pas leur donner de principes parce que nous ne savons littéralement même pas pourquoi cela fonctionne aussi bien."
Lenka Zdeborová de l'EPFL travaille sur cette question fondamentale. Professeure agrégée de physique, d'informatique et de systèmes de communication au laboratoire de physique statistique du calcul, qui fait partie de l'École des sciences fondamentales (BS) et de l'IC, elle est passionnée par l'avancement de la théorie de ce qui est calculable et de ce qui est possible avec l'apprentissage automatique et l'intelligence artificielle. .
"En sciences, nous voulons mieux comprendre les objets que nous étudions, l'objectif n'est pas fixe. Nous devons trouver l'objectif pour que le système d'apprentissage automatique soit utile dans l'effort scientifique et examiner le rôle que joue l'apprentissage automatique dans changer la méthode très scientifique. C'est un domaine fascinant qui a émergé alors que l'apprentissage automatique a connu un grand succès au cours de la dernière décennie."
Avec des collègues de la physique, de la chimie, de l'ingénierie et des sciences de la vie, Zdeborová vient de lancer une nouvelle série de cours doctoraux sur l'apprentissage automatique scientifique qui explorera les derniers travaux entrepris à l'EPFL et dans le monde.
Une autre initiative de l'EPFL - la composante du projet Machine Learning 4 Science du cours Machine Learning des professeurs IC Martin Jaggi et Nicolas Flammarion - établit des collaborations inter-campus, associant des projets scientifiques de laboratoires de toutes disciplines à des étudiants qui apporteront leur expertise en apprentissage automatique à de nouveaux des champs. Entre 2018 et 2020, plus de 600 étudiants ont participé à des projets proposés par 77 laboratoires de l'EPFL, et même d'institutions extérieures, dont le CERN.
"Il s'agit du plus grand cours de niveau master sur le campus et les étudiants de toutes les disciplines veulent apprendre cet outil car ils savent qu'il sera utile pour leur future carrière. Ils peuvent se rendre dans n'importe quel laboratoire du campus et réaliser un projet pratique, en collaboration dans un C'est un véritable gagnant-gagnant et je pense qu'il est juste de dire que les deux parties sentent qu'elles bénéficient de la structure », déclare Jaggi.
L'un des projets du dernier tour émanant du laboratoire de Cathrin Brisken à la Faculté des sciences de la vie (SV) concernait un algorithme d'apprentissage automatique pour distinguer les cellules de souris des cellules humaines, particulièrement utile pour la recherche sur le cancer. Les oncologues étudient généralement les tumeurs en greffant des cellules humaines sur des souris, mais le problème est alors de distinguer les deux types de cellules. Cela implique généralement plusieurs cycles de coloration par fluorescence et l'analyse de nombreux échantillons de tissus avant de trouver les cellules humaines. Cependant, étudiant en IC, le programme de Quentin Juppet simplifie tout cela en automatisant le processus de classification des cellules. C'est tellement prometteur qu'il en a fait un mémoire de maîtrise dont les résultats ont récemment été publiés dans le Journal of Mammary Gland Biology and Neoplasia .
Un autre, également originaire de l'École des sciences de la vie, impliquait l'utilisation de l'apprentissage automatique pour catégoriser les phénotypes mutants à partir d'images d'embryons de poisson zèbre. Le professeur Andrew Oates est doyen de l'école et directeur du laboratoire Timing, Oscillations, Pattern. "Mon laboratoire a participé deux fois et à chaque fois, nous nous sommes engagés avec un groupe vraiment spécial d'étudiants qui ont fait preuve d'initiative et de créativité pour résoudre un problème scientifique réel dans le laboratoire en utilisant l'apprentissage automatique. Autant que je sache, ce projet est une première dans le domaine de l'embryologie avec des implications pour une utilisation plus efficace du poisson zèbre en tant que système de modélisation des troubles génétiques humains. Nous n'aurions pas tenté ce travail si nous n'avions pas eu la chance de rejoindre le programme Machine Learning 4 Science ", dit-il .
D'autres travaux ont porté sur un ensemble incroyablement diversifié de questions de recherche :prédire la gravité de l'AVC à l'aide des données du jeu Pacman ; la détection automatique de la surface disponible pour les installations de panneaux solaires sur le toit ; prévision des avalanches; musique au-delà du majeur et du mineur; et améliorer les mesures de la qualité de l'eau douce.
Pour James Larus, l'avenir est là et il ne fera que s'étonner :"Actuellement, l'apprentissage automatique est basé sur un modèle développé dans les années 1940 sur le fonctionnement du cerveau, et il n'était même pas précis à l'époque. Maintenant, nous explorons l'apprentissage automatique inspiré par le cerveau, guidé par les dernières neurosciences, pour développer des modèles plus sophistiqués et plus efficaces et pour construire des systèmes d'intelligence artificielle de prochaine génération. J'espère donc vraiment qu'il y aura une longue période de progrès dans l'apprentissage automatique et une énorme expansion dans des applications réussies. Cela changera la science pour toujours.