Pour la livraison du dernier kilomètre, les robots du futur pourraient utiliser un nouvel algorithme du MIT pour trouver la porte d'entrée, utilisant des indices dans leur environnement. Crédit :Nouvelles du MIT
Dans un futur pas si lointain, des robots peuvent être envoyés comme véhicules de livraison du dernier kilomètre pour déposer votre commande à emporter, emballer, ou un abonnement à un kit de repas à votre porte, s'ils peuvent trouver la porte.
Les approches standard pour la navigation robotique impliquent de cartographier une zone à l'avance, puis en utilisant des algorithmes pour guider un robot vers un objectif spécifique ou des coordonnées GPS sur la carte. Bien que cette approche puisse avoir du sens pour explorer des environnements spécifiques, tels que l'aménagement d'un bâtiment particulier ou d'un parcours d'obstacles prévu, il peut devenir lourd dans le contexte de la livraison du dernier kilomètre.
Imaginer, par exemple, avoir à cartographier à l'avance chaque quartier dans la zone de livraison d'un robot, y compris la configuration de chaque maison dans ce quartier ainsi que les coordonnées spécifiques de la porte d'entrée de chaque maison. Une telle tâche peut être difficile à étendre à une ville entière, d'autant plus que l'extérieur des maisons change souvent avec les saisons. La cartographie de chaque maison pourrait également se heurter à des problèmes de sécurité et de confidentialité.
Désormais, les ingénieurs du MIT ont développé une méthode de navigation qui ne nécessite pas de cartographier une zone à l'avance. Au lieu, leur approche permet à un robot d'utiliser des indices dans son environnement pour planifier un itinéraire vers sa destination, qui peut être décrit en termes sémantiques généraux, tels que "porte d'entrée" ou "garage, " plutôt que comme coordonnées sur une carte. Par exemple, si un robot est chargé de livrer un colis à la porte d'entrée de quelqu'un, il pourrait commencer sur la route et voir une allée, qu'il a été entraîné à reconnaître comme susceptible de conduire vers un trottoir, qui à son tour est susceptible de conduire à la porte d'entrée.
La nouvelle technique peut réduire considérablement le temps qu'un robot passe à explorer une propriété avant d'identifier sa cible, et il ne repose pas sur des cartes de résidences spécifiques.
"Nous ne voudrions pas avoir à faire une carte de chaque bâtiment que nous aurions besoin de visiter, " dit Michael Everett, un étudiant diplômé du département de génie mécanique du MIT. « Avec cette technique, nous espérons déposer un robot au bout de n'importe quelle allée et lui faire trouver une porte."
Everett présentera les résultats du groupe cette semaine lors de la conférence internationale sur les robots et systèmes intelligents. Le papier, qui est co-écrit par Jonathan How, professeur d'aéronautique et d'astronautique au MIT, et Justin Miller de la Ford Motor Company, est finaliste pour le « Meilleur article pour les robots cognitifs ».
"Un sens de ce que sont les choses"
Dans les années récentes, les chercheurs ont travaillé sur l'introduction du naturel, langage sémantique aux systèmes robotiques, entraîner des robots à reconnaître les objets par leurs étiquettes sémantiques, afin qu'ils puissent traiter visuellement une porte comme une porte, par exemple, et pas simplement comme un solide, obstacle rectangulaire.
« Maintenant, nous avons la capacité de donner aux robots une idée de ce que sont les choses, en temps réel, " dit Everett.
Everett, Comment, et Miller utilisent des techniques sémantiques similaires comme tremplin pour leur nouvelle approche de navigation, qui exploite des algorithmes préexistants qui extraient des caractéristiques à partir de données visuelles pour générer une nouvelle carte de la même scène, représentés comme des indices sémantiques, ou contexte.
Dans leur cas, les chercheurs ont utilisé un algorithme pour créer une carte de l'environnement au fur et à mesure que le robot se déplaçait, en utilisant les étiquettes sémantiques de chaque objet et une image de profondeur. Cet algorithme est appelé SLAM sémantique (Simultaneous Localization and Mapping).
Alors que d'autres algorithmes sémantiques ont permis aux robots de reconnaître et de cartographier les objets de leur environnement pour ce qu'ils sont, ils n'ont pas permis à un robot de prendre des décisions sur le moment tout en naviguant dans un nouvel environnement, sur le chemin le plus efficace à prendre vers une destination sémantique telle qu'une « porte d'entrée ».
"Avant, explorer était juste, jette un robot par terre et dis 'va, " et il se déplacera et finira par y arriver, mais ça va être lent, " Comment dit.
Le coût d'aller
Les chercheurs ont cherché à accélérer la planification du chemin d'un robot grâce à une sémantique, monde de couleur contextuelle. Ils ont mis au point un nouvel « estimateur des coûts à " un algorithme qui convertit une carte sémantique créée par des algorithmes SLAM préexistants en une seconde carte, représentant la probabilité qu'un emplacement donné soit proche de l'objectif.
« Cela a été inspiré par la traduction image à image, où vous prenez une photo d'un chat et le faites ressembler à un chien, " dit Everett. " Le même type d'idée se produit ici où vous prenez une image qui ressemble à une carte du monde, et transformez-la en cette autre image qui ressemble à la carte du monde mais qui est maintenant colorée en fonction de la proximité des différents points de la carte par rapport à l'objectif final."
Cette carte des coûts à emporter est colorisée, en niveaux de gris, pour représenter des régions plus sombres comme des emplacements éloignés d'un objectif, et les régions plus claires comme les zones proches de l'objectif. Par exemple, le trottoir, codé en jaune dans une carte sémantique, pourrait être traduit par l'algorithme du coût à emporter comme une région plus sombre dans la nouvelle carte, par rapport à une allée, qui est de plus en plus clair à mesure qu'il s'approche de la porte d'entrée, la région la plus claire de la nouvelle carte.
Les chercheurs ont formé ce nouvel algorithme sur des images satellites de Bing Maps contenant 77 maisons d'un quartier urbain et de trois quartiers de banlieue. Le système a converti une carte sémantique en une carte des coûts à parcourir, et tracé le chemin le plus efficace, suivant les régions plus claires de la carte, au but final. Pour chaque image satellite, Everett a attribué des étiquettes et des couleurs sémantiques aux caractéristiques contextuelles d'une cour avant typique, comme le gris pour une porte d'entrée, bleu pour une allée, et vert pour une haie.
Au cours de ce processus de formation, l'équipe a également appliqué des masques à chaque image pour imiter la vue partielle qu'aurait probablement la caméra d'un robot lorsqu'il traverse une cour.
"Une partie de l'astuce de notre approche consistait à [donner au système] beaucoup d'images partielles, " Comment explique. " Il fallait donc vraiment comprendre comment tout cela était lié. C'est en partie ce qui fait que cela fonctionne de manière robuste."
Les chercheurs ont ensuite testé leur approche dans une simulation d'une image d'une maison entièrement neuve, en dehors de l'ensemble de données d'entraînement, en utilisant d'abord l'algorithme SLAM préexistant pour générer une carte sémantique, puis en appliquant leur nouvel estimateur de coût restant à parcourir pour générer une deuxième carte, et chemin vers un but, dans ce cas, la porte d'entrée.
La nouvelle technique du coût à emporter du groupe a trouvé la porte d'entrée 189% plus rapide que les algorithmes de navigation classiques, qui ne tiennent pas compte du contexte ou de la sémantique, et à la place, passez des étapes excessives à explorer des zones qui ne sont probablement pas proches de leur objectif.
Everett dit que les résultats illustrent comment les robots peuvent utiliser le contexte pour localiser efficacement un objectif, même inconnu, environnements non cartographiés.
"Même si un robot livre un colis dans un environnement où il n'est jamais allé, il pourrait y avoir des indices qui seront les mêmes que d'autres endroits où il est vu, " dit Everett. " Ainsi, le monde peut être présenté un peu différemment, mais il y a probablement des choses en commun."
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.