• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Une nouvelle étude explore l'humour dans les inclusions de mots

    Représentation des clusters identifiés par les chercheurs. Crédit :Gultchin et al.

    Les progrès dans le domaine de l'IA ont permis le développement d'outils capables de comprendre une variété de langues et de communiquer avec les humains. Cependant, il y a encore des aspects de la communication humaine avec lesquels les systèmes d'IA ont du mal, dont l'un est l'humour.

    Une équipe de chercheurs de l'Université d'Oxford, Microsoft Research et TRASH ont récemment mené une étude sur l'humour dans les insertions de mots. Les imbrications de mots sont un outil d'IA populaire qui peut associer des mots à des vecteurs euclidiens.

    "Nous étions intéressés à étudier comment les ordinateurs pourraient comprendre l'humour, " Adam Kalaï, chercheur de Microsoft qui a réalisé l'étude, a déclaré TechXplore. "Alors que l'IA est assez puissante et peut même traduire d'une langue à une autre, L'IA n'a pas compris l'humour. Nous avons décidé de tester si l'IA pouvait comprendre l'humour au niveau d'un mot individuel, car beaucoup de gens trouvent certains mots comme « nigaud » un peu drôles. »

    Dans leur étude, Kalai et ses collègues ont examiné six caractéristiques principales de l'humour des mots, s'inspirant des théories existantes et des discussions académiques sur l'humour. Ces caractéristiques comprennent :des sons humoristiques (indépendamment de leur signification), juxtapositions/incongruités inattendues, connotation sexuelle, connotations scatologiques, mots insultants et mots familiers.

    Les chercheurs ont étudié dans quelle mesure ces caractéristiques étaient en corrélation avec l'humour et dans quelle mesure une intégration word2vec pré-entraînée sur un corpus de Google News, appelé GNEWS, pourrait capturer chacun d'eux. Un ensemble de données utilisé dans leur étude était l'ensemble de données Engelthaler-Hill (EH), qui se compose de notes d'humour moyennes pour 4, 997 mots, dont chacun a été évalué sur une échelle de un à cinq (par environ 35 évaluateurs humains).

    Pour mieux comprendre les différences de perception des mots drôles, les chercheurs ont également collecté un ensemble de données original plus petit de mots très humoristiques, recruter des anglophones pour étiqueter ces mots via la plate-forme Mechanical Turk d'Amazon. Ils ont mené une série d'études d'évaluation de l'humour, demander aux participants de sélectionner les mots qu'ils trouvent les plus humoristiques, ainsi que d'annoter les mots avec les théories de l'humour pertinentes pour chacun.

    Figure décrivant la relation entre les caractéristiques relatives aux théories des mots dans l'inclusion de mots et leurs cotes d'humour respectives. Crédit :Gultchin et al.

    "Nous avons demandé à plusieurs personnes d'évaluer les mots qu'elles trouvaient les plus humoristiques parmi les mots anglais, " a expliqué Kalai. " Nous avons conçu une étude où les gens ont identifié les mots qu'ils ont trouvés les plus drôles avec un minimum d'effort (le moins de clics). "

    Ensuite, les chercheurs ont étudié comment les caractéristiques de l'humour qu'ils avaient initialement identifiées étaient en corrélation avec les notes d'humour dans leur ensemble de données, pour déterminer l'efficacité des constructions théoriques dans la capture des évaluations données par les humains. En outre, ils ont testé la prévisibilité de ces évaluations à l'aide d'inclusions de mots, explorer dans quelle mesure l'IA pouvait comprendre l'humour.

    "Nous avons découvert que l'IA pouvait comprendre pourquoi les gens trouvaient certains mots plus drôles que d'autres, et l'IA pourrait même comprendre les différences entre les sens de l'humour, " a déclaré Kalai. " L'IA ne comprend toujours pas l'humour dans les phrases ou les textes plus longs, mais nous espérons que notre travail est un point de départ."

    Kalai et ses collègues ont découvert que les imbrications de mots capturaient efficacement les aspects de l'humour des mots évalués sur l'ensemble de données EH, ainsi que des différences dans les notes d'humour de leur nouvel ensemble de données. Leurs découvertes suggèrent en outre que le sens de l'humour des gens pourrait être intégré à l'aide d'une poignée d'évaluations et que les intégrations résultantes pourraient être utilisées pour prédire les évaluations d'humour pour des mots précédemment non évalués.

    "Nos conclusions montrent une application intéressante des inclusions de mots et ouvrent la voie à leur exploitation pour faire plus de travail d'humour sur l'IA, comme générer ou prédire des mots humoristiques correspondant aux sens de l'humour individuels, et dans l'ensemble, " Limor Gultchin, un chercheur de l'Université d'Oxford impliqué dans l'étude, a déclaré TechXplore. "À la fois, nous apportons également une validation supplémentaire aux notions intuitives de l'humour, et les connaissances accumulées dans d'autres domaines, comme la psychologie ou la philosophie.

    L'étude menée par Kalai, Gultchin et leurs collègues montrent que les incrustations de mots pourraient améliorer notre compréhension de l'humour de diverses manières. Premièrement, ils ont découvert que les théories établies de l'humour (par exemple la théorie de la supériorité, théorie de l'incongruité, etc.) sont représentés dans des plongements de mots à des degrés divers et peuvent ainsi être utilisés pour identifier ou prédire l'humour, capturés par les évaluations humaines.

    Tableau reprenant les différences entre un sens de l'humour plus « féminin » et « masculin ». Crédit :Gultchin et al.

    En utilisant des représentations vectorielles de mots, les chercheurs ont également pu définir un sens de l'humour individuel comme un vecteur moyenné, utiliser ces vecteurs pour prédire le sens de l'humour de différentes personnes (c'est-à-dire les notes d'humour qu'ils donneraient à certains mots). Finalement, le regroupement des sens de l'humour leur a permis d'identifier des groupes d'humour, comme "l'humour féminin, ''l'humour masculin, ''un humour plus ancien, ' etc.

    C'est une découverte importante, car il valide l'idée que différents groupes de personnes ont différents sens de l'humour. Par exemple, ils ont observé que les mots sexuels (par exemple « coquelicot ») étaient plus amusants pour les hommes que pour les femmes, tandis que les femmes réagissaient davantage aux mots « drôles » (par exemple, « gobbledegook »).

    "A l'ère des systèmes d'IA répandus, tels que les systèmes de recommandation ou les assistants automatisés, l'humour s'avérerait probablement important pour faciliter une une interaction plus fluide entre les utilisateurs et les systèmes automatisés, " a déclaré Gultchin. " Nous espérons que ce travail servira de preuve de concept montrant que les outils de PNL existants peuvent déjà nous aider à atteindre cet objectif. "

    Kalain, Gultchin et leurs collègues mettront à la disposition du public les nouveaux ensembles de données utilisés dans leur étude, afin que d'autres chercheurs puissent les utiliser dans leurs études. Ils pensent que l'amélioration de la compréhension de l'humour des mots par les systèmes d'IA pourrait ouvrir plusieurs possibilités intéressantes, conduisant par exemple au développement d'outils d'aide aux comédiens ou à l'amélioration des interactions entre les machines et les êtres humains.

    "Nous sommes encore en train de voir comment ce travail sera accepté, mais plusieurs directions futures existent, " a déclaré Gultchin. " Il serait vraiment intéressant de voir si les concepts présentés ici pourraient effectivement être utilisés dans un système interactif qui produit des modifications "drôles" de phrases basées sur le sens de l'humour d'un individu, tel que représenté à l'aide de plongements de mots. Une autre direction intéressante est de voir si nous pouvons éventuellement apprendre à prédire et générer des phrases pleines d'humour ou, avec les évolutions récentes, paragraphes pleins d'humour."

    © 2019 Réseau Science X




    © Science https://fr.scienceaq.com