Un robot a besoin d'apprendre à connaître son corps et l'environnement. Il essaie quelques mouvements différents et utilise l'algorithme. Il peut alors prédire ce qui se passera avec des mouvements plus importants et à des vitesses plus élevées. Crédit :IST Autriche/Birgit Rieger
Comprendre comment un robot réagira dans différentes conditions est essentiel pour garantir son fonctionnement en toute sécurité. Mais comment savoir ce qui cassera un robot sans l'endommager réellement ? Une nouvelle méthode développée par des scientifiques de l'Institute of Science and Technology Austria (IST Austria) et de l'Institut Max Planck pour les systèmes intelligents (MPI pour Intelligent Systems) est la première méthode d'apprentissage automatique qui peut utiliser des observations faites dans des conditions sûres pour faire des prédictions précises. pour toutes les conditions possibles régies par la même dynamique physique. Spécialement conçu pour des situations réelles, leur méthode fournit simple, descriptions interprétables de la physique sous-jacente. Les chercheurs présenteront leurs résultats demain lors de la prestigieuse Conférence internationale pour l'apprentissage automatique (ICML) de cette année.
Autrefois, l'apprentissage automatique n'était capable que d'interpoler des données - faire des prédictions sur des situations qui sont "entre" d'autres, situations connues. Il était incapable d'extrapoler - faire des prédictions sur des situations en dehors du connu - car il apprend à s'adapter le plus possible aux données connues localement, indépendamment de ses performances en dehors de ces situations. En outre, la collecte de données suffisantes pour une interpolation efficace est à la fois gourmande en temps et en ressources, et nécessite des données provenant de situations extrêmes ou dangereuses. Mais maintenant, Georg Martius, ancien postdoc ISTFELLOW et IST Autriche, et depuis 2017 chef de groupe chez MPI for Intelligent Systems à Tübingen, Subham S. Sahoo, un doctorat étudiant également au MPI pour les Systèmes Intelligents, et Christoph Lampert, professeur à l'IST Autriche, développé une nouvelle méthode d'apprentissage automatique qui résout ces problèmes, et est la première méthode d'apprentissage automatique à extrapoler avec précision à des situations invisibles.
La caractéristique clé de la nouvelle méthode est qu'elle s'efforce de révéler la véritable dynamique de la situation :elle recueille des données et renvoie les équations qui décrivent la physique sous-jacente. "Si vous connaissez ces équations, " dit Georg Martius, « alors vous pouvez dire ce qui se passera dans toutes les situations, même si vous ne les avez pas vus." En d'autres termes, c'est ce qui permet à la méthode d'extrapoler de manière fiable, le rendant unique parmi les méthodes d'apprentissage automatique.
La méthode de l'équipe se distingue également de plusieurs autres manières. D'abord, les approximations finales précédemment produites au cours de l'apprentissage automatique étaient beaucoup trop complexes pour qu'un humain puisse les comprendre ou travailler avec. Dans la nouvelle méthode, les équations qui en résultent sont bien plus simples :« Les équations de notre méthode sont quelque chose que vous verriez dans un manuel - simples et intuitives, " explique Christoph Lampert. Cette dernière différence est une autre différence clé :d'autres méthodes d'apprentissage automatique ne donnent aucun aperçu de la relation entre les conditions et les résultats. aucune intuition sur la plausibilité du modèle. « Dans tous les autres domaines de recherche, nous attendons des modèles qui ont un sens physique, qui nous disent pourquoi, " ajoute Lampert. " C'est ce que l'on doit attendre du machine learning, et ce que notre méthode apporte." Enfin, afin de garantir l'interprétabilité et l'optimisation des situations physiques, l'équipe a basé sa méthode d'apprentissage sur un autre type de cadre. Cette nouvelle conception est plus simple que les méthodes précédentes, ce qui signifie en pratique que moins de données sont nécessaires pour obtenir des résultats identiques ou même meilleurs.
Et ce n'est pas que de la théorie :« Dans mon groupe, nous travaillons actuellement sur le développement d'un robot qui utilise ce type d'apprentissage. À l'avenir, le robot expérimenterait différents mouvements, puis être capable d'utiliser le machine learning pour découvrir les équations qui régissent son corps et son mouvement, lui permettant d'éviter des actions ou des situations dangereuses, " ajoute Martius. Si les robots sont un domaine de recherche actif, la méthode peut être utilisée avec tout type de données, des systèmes biologiques aux énergies de transition des rayons X, et peuvent également être incorporés dans des réseaux d'apprentissage automatique plus vastes.