Le montage expérimental lorsque le sujet (à gauche) s'entretient avec ERICA (à droite) Crédit :Kyoto University / Kawahara lab
Nous avons tous essayé de parler avec des appareils, et dans certains cas, ils répondent. Mais, c'est loin d'avoir une conversation avec une vraie personne. Maintenant, une équipe de recherche de l'Université de Kyoto, Université d'Osaka, et l'Institut de recherche sur les télécommunications avancées, ou ATR, a considérablement amélioré le système d'interaction pour l'Android conversationnel ERICA, lui donnant encore plus de capacités de dialogue.
ERICA est un androïde créé par Hiroshi Ishiguro de l'Université d'Osaka et ATR, spécialement conçu pour une conversation naturelle grâce à l'incorporation d'expressions faciales et de gestes humains. L'équipe de recherche a démontré les mises à jour lors d'un symposium au Musée national des sciences émergentes à Tokyo.
"Quand on se parle, ce n'est jamais une simple progression d'informations en avant et en arrière, " déclare Tatsuya Kawahara de la Graduate School of Informatics de l'Université de Kyoto, et un expert en traitement de la parole et de l'audio. "L'écoute est active. Nous exprimons notre accord en hochant la tête ou en disant 'uh-huh' pour maintenir l'élan de la conversation. C'est ce qu'on appelle 'backchanneling', ' et c'est quelque chose que nous voulions mettre en œuvre avec ERICA."
L'équipe s'est également concentrée sur le développement d'un système d'« écoute attentive ». C'est à ce moment qu'un auditeur pose des questions élaborées, ou répète le dernier mot de la phrase du locuteur, permettant un dialogue plus engageant. Déploiement d'une série de capteurs de distance, caméras de reconnaissance faciale et réseaux de microphones, l'équipe a commencé à collecter des données sur les paramètres nécessaires à un dialogue fluide entre ERICA et un sujet humain.
"Nous avons examiné trois qualités lors de l'étude du backchanneling, " poursuit Kawahara. " Il s'agissait des éléments suivants :le moment où une réponse se produit ; forme lexicale :ce qui est dit; et la prosodie, ou comment la réponse se produit.
Les réponses ont été générées par apprentissage automatique à l'aide d'un corpus de dialogue de conseil, résultant en un engagement de dialogue considérablement amélioré. Test en sessions de cinq minutes avec un sujet humain, ERICA a fait preuve d'une compétence orale nettement plus dynamique, y compris l'utilisation du backchanneling, répétitions partielles, et les évaluations des déclarations.
"Faire un robot conversationnel à l'image de l'humain est un défi majeur, " déclare Kawahara. " Ce projet révèle toute la complexité de l'écoute, que nous pourrions considérer comme banal. Nous approchons du jour où un robot pourra réussir un test de Turing total."