Crédit :Garg et al.
Les progrès de la robotique et de l'intelligence artificielle (IA) permettent le développement d'agents artificiels conçus pour aider les humains dans divers contextes quotidiens. L'une des nombreuses utilisations possibles de ces systèmes pourrait être d'escorter des humains ou des biens de valeur qui sont transférés d'un endroit à un autre, les défendre contre les menaces ou les attaques.
Fasciné par cette idée, une équipe de chercheurs de l'Université du Nouveau-Mexique a récemment introduit une nouvelle solution de bout en bout pour coordonner les équipes d'escortes robotiques qui protègent des charges utiles ou des marchandises de grande valeur. La technique qu'ils proposaient, présenté dans un article pré-publié sur arXiv, est basé sur l'apprentissage par renforcement profond (RL), ce qui implique la formation d'algorithmes pour faire des prédictions efficaces en analysant les données.
« J'ai d'abord eu l'idée de cette étude en pensant à trimballer ma valise dans un aéroport bondé, " Lydie Tapia, le chercheur principal de l'étude, a déclaré TechXplore. « Je me suis dit :et si cela pouvait faciliter ma navigation en restant avec moi et en me gardant en marchant ? »
Avant de commencer à développer leur solution de coordination des équipes d'escortes défensives, Tapia et son équipe ont examiné la littérature antérieure à la recherche d'inspiration ou d'approches similaires. Malheureusement, cependant, ils n'ont pas pu trouver d'autres études dans lesquelles des robots étaient utilisés pour prédire les menaces entrantes et les intercepter, protéger les utilisateurs humains et s'assurer qu'ils atteignent leur destination en toute sécurité.
"Il y a beaucoup de travail sur les assistants de navigation, mais la plupart du temps, ils fonctionnent en déclenchant une alarme pour empêcher une personne de naviguer à proximité d'une menace entrante, " a expliqué Tapia. " Nous avons découvert qu'une équipe d'escorte robotique pouvait avoir plusieurs autres applications dans des scénarios critiques pour la sécurité, bien plus important que ma valise d'aéroport, nous avons donc concentré cet article sur la navigation de la charge utile, ce qui est une tâche courante où les escortes gardent la charge utile en sécurité pendant la navigation."
Tapia et ses collègues ont entraîné leur modèle RL profond pour prédire des positions et des stratégies efficaces pour intercepter les menaces possibles. Comme d'autres techniques de RL, pendant la formation, leur modèle a traversé une longue série d'essais dans lesquels il a dû proposer des actions pour intercepter les menaces et coordonner les escortes, recevoir des récompenses lorsque la stratégie qu'il proposait était efficace. Heures supplémentaires, le modèle a appris à généraliser ce qu'il a appris pendant la formation et à l'appliquer à des situations entièrement nouvelles.