Une scène d'une vidéo de démonstration qui simule l'expérience. Crédit :Ozaki et al.
Des chercheurs de NTT Corporation au Japon ont récemment développé une approche d'apprentissage par renforcement centrée sur l'utilisateur qui pourrait être utilisée pour enseigner les « manières » aux robots sociaux. Leur méthode, décrit dans un article prépublié sur arXiv, permet à un robot de saluer ou d'attirer l'attention des passants sans les gêner.
"Mon idée a été inspirée par des aboyeurs sur un marché, " Yasunori Ozaki, l'un des chercheurs qui a mené l'étude, a déclaré TechXplore. "La plupart des aboyeurs appellent les passants intéressés par le restaurant, pourtant ils appellent à peine les autres. A la suite de ce constat, J'ai émis l'hypothèse suivante :les aboyeurs déterminent quel passant appeler en déduisant de leur comportement leur intérêt pour le service qu'ils annoncent. J'ai voulu développer une méthode qui permet à un robot d'imiter les actions d'un aboyeur, en l'entraînant à comprendre les intérêts des gens."
Les robots sociaux entrent progressivement dans une variété de domaines, y compris les soins de santé et le commerce de détail. En détail, par exemple, les robots sociaux pourraient aider à expliquer les produits aux passants et aux clients potentiels.
Récemment, un nombre croissant d'entreprises ont commencé à tester l'efficacité des robots en tant qu'agents de service client, comme les réceptionnistes, guides ou exposants. Pour être plus efficace dans les rôles en contact avec le client, cependant, les robots auraient besoin de saluer les passants sans les surprendre ni les mettre mal à l'aise.
Avec ça en tête, Ozaki et ses collègues ont entrepris de développer une méthode permettant aux robots d'adapter leurs manières en fonction de la situation dans laquelle ils se trouvent et de la personne avec laquelle ils interagissent. Leur approche utilise un apprentissage par renforcement centré sur l'utilisateur pour analyser les données collectées par les capteurs d'un robot, afin qu'il puisse adapter ses actions en conséquence.
L'environnement expérimental. Crédit :Ozaki et al.
"Ma méthode permet à un robot d'apprendre des actions en observant les réactions des passants, " expliqua Ozaki. " Quand un robot agit envers un passant, le passant réagit généralement à une telle action. Par exemple, si un robot appelle un passant, l'appel pourrait causer une gêne au passant, ou peut amener le passant à s'intéresser au robot. Le robot estime le ressenti d'un passant à partir de ses réactions, en analysant les images recueillies par un capteur placé à l'arrière."
L'approche imaginée par Ozaki et ses collègues est basée sur un système de récompenses et de pénalités. Si le robot induit une gêne chez les passants avec lesquels il communique, il obtient une pénalité. D'autre part, si un passant s'arrête, interagit avec le robot et s'y intéresse, le robot reçoit une récompense. Heures supplémentaires, le robot apprend à adapter ses stratégies d'interaction afin d'attirer l'attention des gens sans mettre les clients potentiels mal à l'aise.
"Ma méthode permet à un robot de trouver des combinaisons d'actions qui ne gênent pas les passants, " a déclaré Ozaki. " De nombreux chercheurs ont examiné l'expérience utilisateur (UX), y compris l'inconfort, dans les interactions homme-robot. Cependant, ils n'ont pas formé de robots basés sur cette UX. Je crois que nous devons enseigner aux robots certaines manières liées à l'UX et au monde humain. Cela permettrait ensuite au robot d'adapter ses actions à différentes situations et utilisateurs, sur la base des manières qu'il a acquises.
Pour évaluer leur méthode, les chercheurs ont mené une expérience à l'entrée d'un bureau, dans lequel un petit robot social interpellait les passants et tentait d'attirer leur attention. Leurs découvertes étaient très prometteuses, comme dans la plupart des cas, le robot était capable d'attirer l'attention des gens sans les gêner.
L'approche conçue par Ozaki et ses collègues est conçue pour améliorer les interactions du robot avec les passants individuels, plutôt qu'avec un plus grand groupe de personnes. D'autres études pourraient étendre le modèle pour améliorer également les interactions du robot avec des groupes de personnes. En outre, les chercheurs envisagent d'évaluer leur méthode dans des scénarios où le robot social couvre d'autres rôles, par exemple celui d'un vendeur.
© 2019 Réseau Science X