• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Un modèle aide les robots à naviguer plus comme les humains

    Les chercheurs du MIT ont mis au point un moyen d'aider les robots à naviguer dans les environnements plus comme le font les humains. Crédit :Massachusetts Institute of Technology

    Lorsque vous vous déplacez dans une foule pour atteindre un objectif final, les humains peuvent généralement naviguer dans l'espace en toute sécurité sans trop réfléchir. Ils peuvent apprendre du comportement des autres et noter les obstacles à éviter. Robots, d'autre part, lutter avec de tels concepts de navigation.

    Les chercheurs du MIT ont maintenant mis au point un moyen d'aider les robots à naviguer dans les environnements plus comme le font les humains. Leur nouveau modèle de planification de mouvement permet aux robots de déterminer comment atteindre un objectif en explorant l'environnement, observer d'autres agents, et en exploitant ce qu'ils ont appris auparavant dans des situations similaires. Un article décrivant le modèle a été présenté lors de la conférence internationale IEEE/RSJ de cette semaine sur les robots et systèmes intelligents (IROS).

    Les algorithmes de planification de mouvement populaires créeront un arbre de décisions possibles qui se ramifie jusqu'à ce qu'il trouve de bons chemins pour la navigation. Un robot qui doit naviguer dans une pièce pour atteindre une porte, par exemple, va créer un arbre de recherche étape par étape des mouvements possibles et ensuite exécuter le meilleur chemin vers la porte, compte tenu de diverses contraintes. Un inconvénient, cependant, Est-ce que ces algorithmes apprennent rarement :les robots ne peuvent pas exploiter les informations sur la façon dont eux-mêmes ou d'autres agents ont agi auparavant dans des environnements similaires.

    "Comme quand on joue aux échecs, ces décisions se ramifient jusqu'à ce que [les robots] trouvent un bon moyen de naviguer. Mais contrairement aux joueurs d'échecs, [les robots] explorent à quoi ressemble l'avenir sans en apprendre beaucoup sur leur environnement et les autres agents, " dit le co-auteur Andrei Barbu, chercheur au Laboratoire d'informatique et d'intelligence artificielle (CSAIL) du MIT et au Center for Brains, Esprits, and Machines (CBMM) au sein de l'Institut McGovern du MIT. "La millième fois qu'ils traversent la même foule, c'est aussi compliqué que la première fois. Ils explorent toujours, observant rarement, et ne jamais utiliser ce qui s'est passé dans le passé."

    Les chercheurs ont développé un modèle qui combine un algorithme de planification avec un réseau de neurones qui apprend à reconnaître les chemins qui pourraient conduire au meilleur résultat, et utilise ces connaissances pour guider le mouvement du robot dans un environnement.

    Dans leur papier, "Modèles séquentiels profonds pour la planification basée sur l'échantillonnage, " les chercheurs démontrent les avantages de leur modèle dans deux contextes :naviguer dans des salles difficiles avec des pièges et des passages étroits, et naviguer dans les zones tout en évitant les collisions avec d'autres agents. Une application prometteuse du monde réel aide les voitures autonomes à naviguer aux intersections, où ils doivent évaluer rapidement ce que les autres feront avant de se fondre dans le trafic. Les chercheurs poursuivent actuellement de telles applications par le biais du Centre de recherche commun Toyota-CSAIL.

    "Lorsque les humains interagissent avec le monde, nous voyons un objet avec lequel nous avons déjà interagi, ou sont dans un endroit où nous sommes déjà allés, donc on sait comment on va agir, " dit Yen-Ling Kuo, un doctorat au CSAIL et premier auteur de l'article. "L'idée derrière ce travail est d'ajouter à l'espace de recherche un modèle d'apprentissage automatique qui sait par expérience passée comment rendre la planification plus efficace."

    Boris Katz, chercheur principal et responsable du Groupe InfoLab au CSAIL, est également co-auteur de l'article.

    Négocier l'exploration et l'exploitation

    Les planificateurs de mouvement traditionnels explorent un environnement en développant rapidement un arbre de décisions qui couvre finalement un espace entier. Le robot regarde alors l'arbre pour trouver un moyen d'atteindre le but, comme une porte. Le modèle des chercheurs, cependant, offre « un compromis entre l'exploration du monde et l'exploitation des connaissances passées, " dit Kuo.

    Le processus d'apprentissage commence par quelques exemples. Un robot utilisant le modèle est formé à quelques façons de naviguer dans des environnements similaires. Le réseau de neurones apprend ce qui fait le succès de ces exemples en interprétant l'environnement autour du robot, comme la forme des murs, les actions d'autres agents, et les caractéristiques des buts. En bref, le modèle "apprend que lorsque vous êtes coincé dans un environnement, et tu vois une porte, c'est probablement une bonne idée de passer la porte pour sortir, " dit Barbu.

    Le modèle combine le comportement d'exploration des méthodes précédentes avec ces informations apprises. Le planificateur sous-jacent, appelé RRT*, a été développé par les professeurs du MIT Sertac Karaman et Emilio Frazzoli. (C'est une variante d'un algorithme de planification de mouvement largement utilisé connu sous le nom d'arbres aléatoires à exploration rapide, ou RRT.) Le planificateur crée un arbre de recherche tandis que le réseau de neurones reflète chaque étape et fait des prédictions probabilistes sur la prochaine étape du robot. Lorsque le réseau fait une prédiction avec un niveau de confiance élevé, sur la base d'informations acquises, il guide le robot sur un nouveau chemin. Si le réseau n'a pas une confiance élevée, il permet au robot d'explorer l'environnement à la place, comme un planificateur traditionnel.

    Par exemple, les chercheurs ont démontré le modèle dans une simulation connue sous le nom de "piège à insectes, " où un robot 2D doit s'échapper d'une chambre intérieure par un canal étroit central et atteindre un emplacement dans une pièce plus grande environnante. Les alliés aveugles de chaque côté du canal peuvent bloquer les robots. Dans cette simulation, le robot a été formé sur quelques exemples pour échapper à différents pièges à insectes. Face à un nouveau piège, il reconnaît les caractéristiques du piège, s'échappe, et continue de chercher son but dans la plus grande salle. Le réseau de neurones aide le robot à trouver la sortie du piège, identifier les impasses, et donne au robot une idée de son environnement afin qu'il puisse rapidement trouver le but.

    Les résultats de l'article sont basés sur les chances qu'un chemin soit trouvé après un certain temps, longueur totale du chemin qui a atteint un objectif donné, et à quel point les chemins étaient cohérents. Dans les deux simulations, le modèle des chercheurs a tracé plus rapidement des chemins beaucoup plus courts et cohérents qu'un planificateur traditionnel.

    Travailler avec plusieurs agents

    Dans une autre expérience, les chercheurs ont formé et testé le modèle dans des environnements de navigation avec plusieurs agents mobiles, qui est un test utile pour les voitures autonomes, en particulier la navigation dans les intersections et les ronds-points. Dans la simulation, plusieurs agents contournent un obstacle. Un agent robot doit naviguer avec succès autour des autres agents, éviter les collisions, et atteindre un emplacement de but, comme une sortie sur un rond-point.

    "Les situations comme les ronds-points sont difficiles, parce qu'ils nécessitent un raisonnement sur la façon dont les autres réagiront à vos actions, comment vous répondrez ensuite aux leurs, ce qu'ils feront ensuite, etc, " dit Barbu. " Vous finissez par découvrir que votre première action était mauvaise, car plus tard, cela conduira à un accident probable. Ce problème s'aggrave de façon exponentielle au fur et à mesure que vous devez faire face à de nombreuses voitures."

    Les résultats indiquent que le modèle des chercheurs peut capturer suffisamment d'informations sur le comportement futur des autres agents (voitures) pour interrompre le processus plus tôt, tout en prenant de bonnes décisions en navigation. Cela rend la planification plus efficace. De plus, ils n'avaient besoin d'entraîner le modèle que sur quelques exemples de ronds-points avec seulement quelques voitures. "Les plans des robots prennent en compte ce que les autres voitures vont faire, comme n'importe quel humain le ferait, " dit Barbu.

    Traverser des intersections ou des ronds-points est l'un des scénarios les plus difficiles auxquels sont confrontées les voitures autonomes. Ce travail pourrait un jour permettre aux voitures d'apprendre comment les humains se comportent et comment s'adapter aux conducteurs dans différents environnements, selon les chercheurs. C'est l'objet des travaux du Centre commun de recherche Toyota-CSAIL.

    "Tout le monde ne se comporte pas de la même manière, mais les gens sont très stéréotypés. Il y a des gens timides, les gens qui sont agressifs. Le modèle le reconnaît rapidement et c'est pourquoi il peut planifier efficacement, " dit Barbu.

    Plus récemment, les chercheurs ont appliqué ce travail à des robots avec des manipulateurs qui font face à des défis tout aussi intimidants lorsqu'ils cherchent des objets dans des environnements en constante évolution.

    Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.




    © Science https://fr.scienceaq.com