Un exemple de conversation entre les chercheurs et Erica. Crédit :Inoue et al
Depuis au moins l'époque des esprits curieux comme Platon, les philosophes et les scientifiques se sont interrogés sur la question « Qu'est-ce qui est si drôle ? » Les Grecs attribuaient la source de l'humour au fait de se sentir supérieur aux dépens des autres. Le psychanalyste allemand Sigmund Freud croyait que l'humour était un moyen de libérer l'énergie refoulée. Le comédien américain Robin Williams a exploité sa colère contre l'absurde pour faire rire les gens.
Il semble que personne ne soit vraiment d'accord sur la question "Qu'est-ce qui est si drôle?" Alors imaginez essayer d'apprendre à un robot à rire. Mais c'est exactement ce qu'une équipe de chercheurs de l'Université de Kyoto au Japon tente de faire en concevant une IA qui s'inspire d'un système de rire partagé. Les scientifiques décrivent leur approche innovante pour construire un os amusant pour l'androïde japonais "Erica" dans le dernier numéro de la revue Frontiers in Robotics and AI .
Ce n'est pas comme si les robots ne pouvaient pas détecter le rire ou même émettre un petit rire à une mauvaise blague de papa. Le défi consiste plutôt à créer les nuances humaines de l'humour pour un système d'IA afin d'améliorer les conversations naturelles entre les robots et les humains.
"Nous pensons que l'une des fonctions importantes de l'IA conversationnelle est l'empathie", a expliqué l'auteur principal, le Dr Koji Inoue, professeur adjoint à l'Université de Kyoto au Département des sciences et technologies de l'intelligence au sein de la Graduate School of Informatics. "La conversation est, bien sûr, multimodale, et ne se contente pas de répondre correctement. Nous avons donc décidé que l'un des moyens par lesquels un robot peut sympathiser avec les utilisateurs est de partager leur rire, ce que vous ne pouvez pas faire avec un chatbot textuel."
Une chose amusante s'est produite
Dans le modèle du rire partagé, un humain rit d'abord et le système d'IA répond par le rire comme une réponse empathique. Cette approche a nécessité la conception de trois sous-systèmes :un pour détecter le rire, un second pour décider de rire et un troisième pour choisir le type de rire approprié.
Les scientifiques ont recueilli des données de formation en annotant plus de 80 dialogues de speed dating, un scénario social où de grands groupes de personnes se mêlent ou interagissent les uns avec les autres pendant une brève période. Dans ce cas, le marathon de jumelage impliquait des étudiants de l'Université de Kyoto et d'Erica, téléopérés par plusieurs actrices amateurs.
"Notre plus grand défi dans ce travail a été d'identifier les cas réels de rires partagés, ce qui n'est pas facile, car comme vous le savez, la plupart des rires ne sont en fait pas du tout partagés", a déclaré Inoue. "Nous avons dû catégoriser avec soin les rires que nous pouvions utiliser pour notre analyse et ne pas simplement supposer qu'il était possible de répondre à n'importe quel rire."
Le type de rire est également important, car dans certains cas, un rire poli peut être plus approprié qu'un éclat de rire bruyant. L'expérience était limitée aux rires sociaux par rapport aux rires joyeux.
Le robot l'obtient
L'équipe a finalement testé le nouveau sens de l'humour d'Erica en créant quatre courts dialogues de deux à trois minutes entre une personne et Erica avec son nouveau système de rire partagé. Dans le premier scénario, elle n'a émis que des rires sociaux, suivis uniquement de rires joyeux dans les deuxième et troisième échanges, les deux types de rires étant combinés dans le dernier dialogue. L'équipe a également créé deux autres ensembles de dialogues similaires en tant que modèles de base. Dans le premier, Erica ne rit jamais. Dans le second, Erica émet un rire social chaque fois qu'elle détecte un rire humain sans utiliser les deux autres sous-systèmes pour filtrer le contexte et la réponse.
Les chercheurs ont recruté plus de 130 personnes au total pour écouter chaque scénario dans les trois conditions différentes - système de rire partagé, pas de rire, tout rire - et ont évalué les interactions en fonction de l'empathie, du naturel, de la ressemblance humaine et de la compréhension. Le système de rire partagé a mieux fonctionné que les deux lignes de base.
"Le résultat le plus significatif de cet article est que nous avons montré comment nous pouvons combiner ces trois tâches en un seul robot. Nous pensons que ce type de système combiné est nécessaire pour un bon comportement de rire, pas simplement pour détecter un rire et y répondre. », a déclaré Inoue.
Comme de vieux amis
Il y a encore beaucoup d'autres styles de rire sur lesquels modéliser et entraîner Erica avant qu'elle ne soit prête à se lancer sur le circuit du stand-up. "Il existe de nombreuses autres fonctions et types de rire qui doivent être pris en compte, et ce n'est pas une tâche facile. Nous n'avons même pas tenté de modéliser les rires non partagés, même s'ils sont les plus courants", a noté Inoue.
Bien sûr, le rire n'est qu'un aspect d'avoir une conversation humaine naturelle avec un robot.
"Les robots devraient en fait avoir un caractère distinct, et nous pensons qu'ils peuvent le montrer à travers leurs comportements conversationnels, tels que le rire, le regard, les gestes et le style de parole", a ajouté Inoue. "Nous ne pensons pas que ce soit un problème facile du tout, et cela pourrait bien prendre plus de 10 à 20 ans avant que nous puissions enfin avoir une conversation informelle avec un robot comme nous le ferions avec un ami." Pouvons-nous distinguer le groupe culturel de quelqu'un d'après sa façon de rire ?