La conférence Dawn or Doom 2018 présente des exposés de plus de trois douzaines de membres du corps professoral de Purdue et d'experts nationaux représentant quatre domaines — Machines :intelligence artificielle, robotique, véhicules autonomes et drones; Esprit :effets d'Internet et des médias sociaux ; Corps :bio-ingénierie et conception humaine ; et données :Internet des objets, confidentialité et cybersécurité. Crédit :Université Purdue
"Je me sent malade." "Ce jeu vidéo est MALADE !" Vers un ordinateur, le mot « malade » peut avoir le même sens dans ces deux phrases.
Mais un professeur de Purdue combine l'apprentissage automatique avec des modèles de relations sociales et de comportement pour lire entre les lignes du texte et capturer l'intention de l'auteur de manière plus approfondie. La technologie pourrait aider à identifier les biais dans les publications sur les réseaux sociaux et les articles de presse, pour mieux juger de la validité de l'information.
Le traitement traditionnel du langage naturel consiste à se concentrer sur des mots-clés - par exemple, le mot « bon » indiquerait normalement une opinion positive. Cela fonctionne bien pour certaines applications, mais n'est pas utile lorsque le texte est ambigu, par exemple si l'auteur voulait qu'un mot ou une phrase soit sarcastique ou ironique.
C'est là qu'intervient l'approche du professeur Purdue Dan Goldwasser. Il se concentre particulièrement sur l'actualité et les questions politiques, et analyse les articles de presse et les tweets des politiciens pour tenter de déterminer comment l'auteur encadre certains problèmes et quelle est son idéologie.
Goldwasser, professeur assistant en informatique, parlera de ce travail à Dawn ou Doom '18, Conférence annuelle de Purdue sur les risques et les avantages des technologies émergentes. Dawn or Doom aura lieu sur le campus West Lafayette de Purdue les lundi et mardi (5 et 6 novembre). La conférence, maintenant dans sa cinquième année, est gratuit et ouvert au public.
Dawn or Doom est aligné sur la campagne du 150e anniversaire de Giant Leaps de Purdue et fait partie du thème du festival des idées, Des pas de géant dans l'intelligence artificielle, Algorithmes, et automatisation :équilibrer l'humanité et la technologie. Le festival des idées est la pièce maîtresse de la campagne et relie des conférenciers de renommée mondiale et l'expertise de Purdue dans une conversation sur les problèmes et les opportunités les plus critiques auxquels le monde est confronté.
Dans un projet, Goldwasser analyse les publications Twitter de responsables politiques. Les tweets peuvent être une forme de texte difficile à interpréter, car ils sont courts et peuvent être ambigus. Par exemple, après une fusillade de masse, l'expression « pensées et prières » peut être utilisée pour exprimer sincèrement sa sympathie aux familles des victimes, mais il peut aussi être utilisé de manière sarcastique pour critiquer le manque d'action du gouvernement en matière de contrôle des armes à feu.
Goldwasser et son équipe essaient de comprendre comment les politiciens cadrent les problèmes ou les événements, et comment ce cadre éclaire leur position sur la question. Pour faire ça, il combine l'analyse linguistique avec la modélisation des relations sociales et du comportement. Les réseaux sociaux peuvent donner un aperçu du sens du texte, car si deux personnes sont étroitement liées, ils sont susceptibles de partager des idéologies similaires. Comportement, comme lorsqu'un individu publie sur les réseaux sociaux, peuvent prédire les problèmes qui les préoccupent. La combinaison des trois modèles donne une image plus complète de l'intention de l'auteur que de se fier à l'un d'eux seul.
Dans un autre projet, financé par Google, Goldwasser utilise des modèles de relations sociales pour essayer d'identifier les biais dans les sources d'information. Les mots-clés peuvent être un bon moyen de différencier l'idéologie pour un petit ensemble de données. Par exemple, un article sur une fusillade de masse qui se concentre sur la santé mentale du tireur est plus susceptible d'avoir un point de vue conservateur, alors qu'un article qui explique comment l'arme a été obtenue est plus susceptible d'avoir une perspective libérale.
"Le problème est que l'identification manuelle des indicateurs pertinents pour chaque événement est difficile à mettre à l'échelle, " dit Goldwasser.
Au lieu, son équipe recueille plusieurs articles de presse sur le même événement et construit un réseau de personnes qui partagent les articles sur les réseaux sociaux. Sur la base de la connexion du réseau à des individus ou des organisations ayant une orientation politique connue, la perspective de l'article peut être déduite sans avoir à générer manuellement des mots-clés pertinents.