• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Rencontrez Jaco et Baxter, des robots d'apprentissage automatique qui cuisinent des hot-dogs parfaits

    Crédit :CC0 Domaine public

    Envie d'une bouchée d'un franc de baseball fraîchement grillé? Deux robots nommés Jaco et Baxter peuvent en servir un. Les ingénieurs de l'Université de Boston ont fait un saut dans l'utilisation de l'apprentissage automatique pour apprendre aux robots à effectuer des tâches complexes, un cadre qui pourrait être appliqué à une multitude de tâches, comme identifier les taches cancéreuses sur les mammographies ou mieux comprendre les commandes vocales pour jouer de la musique. Mais d'abord, comme preuve de concept :ils ont appris à préparer le hot dog parfait.

    Les chercheurs ne comprennent toujours pas exactement comment les algorithmes d'apprentissage automatique — eh bien, apprendre. Cet angle mort rend difficile l'application de la technique à des complexes, tâches à haut risque telles que la conduite autonome, où la sécurité est une préoccupation. Dans un pas en avant publié dans Robotique scientifique , Calin Belta, professeur à la BU College of Engineering, et les chercheurs de son laboratoire ont appris à deux robots à cuisiner, assembler, et servir des hot-dogs ensemble. Leur méthode combine des techniques issues du machine learning et des méthodes formelles, un domaine de l'informatique qui est généralement utilisé pour garantir la sécurité, notamment utilisé dans les logiciels d'avionique ou de cybersécurité. Ces techniques disparates sont difficiles à combiner mathématiquement et à rassembler dans un langage qu'un robot comprendra.

    Belta, professeur de mécanique, systèmes, et génie électrique et informatique, et son équipe a utilisé une branche de l'apprentissage automatique connue sous le nom d'apprentissage par renforcement. Lorsqu'un ordinateur termine une tâche correctement, il reçoit une récompense qui guide son processus d'apprentissage. Bien que les étapes de la tâche soient décrites dans un algorithme de « connaissance préalable », comment exactement effectuer ces étapes ne l'est pas. Lorsque le robot s'améliore dans l'exécution d'une étape, sa récompense augmente, créer un mécanisme de rétroaction qui pousse le robot à apprendre la meilleure façon de, par exemple, placer un hot-dog sur un petit pain.

    Crédit :Université de Boston

    L'intégration des connaissances antérieures avec l'apprentissage par renforcement et les méthodes formelles est ce qui rend cette technique nouvelle. En combinant ces trois techniques, l'équipe peut réduire le nombre de possibilités que les robots doivent parcourir pour apprendre à cuisiner, assembler, et servez un hot dog en toute sécurité. Belta voit ce travail comme une démonstration de preuve de concept de leur cadre général, et il espère qu'à l'avenir, il pourra être appliqué à d'autres tâches complexes, comme la conduite autonome.


    © Science https://fr.scienceaq.com