Crédit :CC0 Domaine Public
Des études antérieures ont montré que les gens peuvent identifier le sexe et la race d'un locuteur en fonction des mots choisis, mais une personne pourrait-elle identifier quelque chose comme une appartenance politique ? Une équipe de chercheurs de l'Université Carnegie Mellon a découvert que les gens réussissent mieux à identifier le langage associé au discours républicain que les modèles de discours démocrates. Les résultats sont disponibles dans le numéro de février de la revue PLOS .
"Alors que d'autres études ont montré que les gens peuvent détecter des catégories sociales comme la race et le sexe d'un choix de mot basé sur le locuteur, il n'y a pas eu de travail pour savoir si c'est vrai pour l'idéologie, " a déclaré Danny Oppenheimer, contributeur à l'étude, professeur de sciences sociales et décisionnelles au Dietrich College of Humanities and Social Sciences. "L'idéologie [politique] est une variable cachée, vous ne pouvez pas dire en regardant à quel parti quelqu'un s'identifie, mais bon nombre de ces catégories invisibles sont encore détectables sur la base d'indices linguistiques."
L'équipe a examiné si les gens peuvent ou non connecter un parti politique à des indices linguistiques spécifiques. L'équipe n'a pas examiné le discours teinté de politique, comme les droits de succession contre les droits de succession, mais comment les synonymes sont utilisés par chaque partie. Les exemples incluent « financier contre monétaire, " "collègue contre ami" ou "gens contre gens". Pour explorer ce concept, l'équipe de recherche a mené quatre expériences pour évaluer dans quelle mesure les participants pouvaient réussir la tâche à un rythme supérieur au hasard.
"Les démocrates et les républicains choisissent des mots différents pour discuter d'un sujet, " a déclaré Oppenheimer. "Nous voulions voir si les gens pouvaient comprendre ce modèle de discours subtil."
Dans l'étude, les chercheurs ont utilisé l'apprentissage automatique pour analyser le Congressional Record (2012 à 2017) et les corpus du débat présidentiel pour isoler les variations linguistiques entre les deux partis politiques. Ils en ont identifié 8, 345 mots qui faisaient partie du corpus républicain et 7, 873 avec le corpus démocrate.
Les résultats des quatre études ont montré que même en contrôlant la définition du mot dans le dictionnaire, les participants sont plus susceptibles d'associer la « langue républicaine » aux républicains.
Oppenheimer pense que les résultats de l'étude peuvent biaiser davantage les républicains, car la période de cinq ans de l'étude a coïncidé avec le contrôle républicain de la Maison Blanche et du Congrès. Il a également noté que la majorité des participants aux quatre études se sont auto-identifiés comme libéraux, et les indices verbaux peuvent être plus forts et plus facilement identifiables par les personnes extérieures au groupe. En outre, le Congressional Record peut ne pas être représentatif de la variété de discours politiques que les gens entendent quotidiennement, ce qui est plus complexe et ajoute du contexte au langage utilisé.
"Le langage que nous utilisons est prédictif, et les humains sont incroyables pour capter les subtils indices sociaux du langage, " a déclaré Oppenheimer. " Dans un monde où nous essayons de créer l'inclusion, s'il existe de simples indices linguistiques que nous pouvons [utiliser] pour que les gens se sentent moins ostracisés, cela pourrait être généralement utile pour progresser vers ces objectifs sociaux. »
Oppenheimer a été rejoint par Sabina Sloman et Simon DeDeo également à l'Université Carnegie Mellon sur le projet intitulé, « Pouvons-nous détecter des variations conditionnées dans le discours politique ? Deux types de discussion et types de conversation.