Crédit :domaine public CC0
Après les révélations sur l'élection présidentielle américaine de 2016 influencée par les "fausses nouvelles" générées par la Russie, de nombreuses personnes sont devenues plus critiques à l'égard des informations sur les réseaux sociaux. Les "fausses nouvelles" ont ensuite été inventées par plusieurs dictionnaires et organisations linguistiques, telles que le Conseil des langues de Norvège, comme étant le mot de l'année 2017. En Norvège, beaucoup d'entre nous ont appris que si quelque chose semble être trop beau pour être vrai, c'est souvent le cas.
Mais qu'en est-il de la langue elle-même ? Peut-elle fournir une indication de la véracité du texte que vous lisez ?
À l'Université d'Oslo, des linguistes travaillent désormais avec des informaticiens et des chercheurs en intelligence artificielle de l'organisme de recherche indépendant SINTEF afin d'exposer le langage des fausses nouvelles, ce qu'ils appellent Fakespeak.
"Nous enquêtons pour voir s'il existe ou non des différences linguistiques entre les vrais et les faux textes d'information en norvégien, en anglais et en russe. Notre objectif est d'améliorer les outils actuels de vérification des faits", déclare Silje Susanne Alvestad.
Elle est à la tête du projet Fakespeak et reconnaît que la linguistique, qui est son domaine d'expertise, peut apporter d'importants avantages sociétaux en luttant contre les fausses informations.
"Depuis plusieurs années, des recherches en études des médias et en informatique ont été menées sur divers aspects des fausses nouvelles, par exemple, la manière dont elles se propagent. Mais en linguistique, il y a eu des lacunes par rapport à ce phénomène", explique Alvestad. .
Le style informel et les verbes au présent peuvent être des signes importants
Certes, certains linguistes se sont attaqués à de faux articles de presse dans le passé. En 2003, le New York Times le journaliste Jayson Blair a été surpris en train de fabriquer un certain nombre d'articles de presse. Jack Grieve et ses collègues de l'Université de Birmingham ont rassemblé ces faux textes dans ce que les linguistes appellent un corpus, en les comparant à une sélection de véritables reportages écrits par Blair.
"Les chercheurs ont supposé que puisque Jayson Blair avait des motifs différents pour écrire ces deux types d'articles - chercher à fournir des informations dans ses textes authentiques et avoir l'intention d'induire les gens en erreur avec ses faux - le style et les caractéristiques linguistiques seraient également différents ", dit Alvestad.
Et bien sûr, les textes étaient de style différent. "Les faux avaient un style informel, tandis que les textes authentiques étaient similaires à d'autres textes contenant une forte densité d'informations."
Les chercheurs britanniques ont découvert plusieurs différences linguistiques :
Alvestad et ses collègues linguistes, Nele Põldvere et Elizaveta Kibisova, s'appuient sur ces découvertes car ils étudient actuellement les caractéristiques linguistiques des fausses nouvelles en norvégien, anglais et russe.
La façon dont les métaphores sont utilisées pourrait être un signe important
Une métaphore est une expression tirée d'un domaine et appliquée à un autre. Par exemple, on peut utiliser une métaphore de la guerre dans le domaine de la santé pour parler de la façon "d'attaquer un virus".
Les chercheurs de l'UiO dirigés par Nele Põldvere ont examiné de plus près l'utilisation des métaphores par Blair.
"Il utilise moins de métaphores dans ses faux articles que lorsqu'il écrit la vérité. Une explication possible à cela est que nous utilisons le plus souvent des métaphores lorsque nous racontons des histoires sur quelque chose que nous avons réellement vécu nous-mêmes", explique Alvestad.
De plus, Blair utilise des éléments linguistiques qui décrivent ou tentent de promouvoir des émotions positives.
"Des recherches antérieures ont montré que lorsque vous voulez délibérément induire les gens en erreur, vous essayez généralement de susciter de fortes émotions négatives. Cependant, l'inverse était vrai avec Jayson Blair. Lorsqu'il écrit de faux articles, il utilise des mots, des phrases et des formulations qui créent des émotions positives. ."
Alvestad souligne que cela pourrait être dû au sujet :plusieurs des textes de Blair étaient de fausses histoires sur des soldats américains héroïques pendant la guerre en Irak.
"Blair voulait présenter la guerre en Irak sous un jour positif."
Un défi pour trouver suffisamment de fake news en norvégien
Lorsque les chercheurs comparent des textes vrais et faux écrits par la même personne, comme ils le font avec les textes de Blair, des données précieuses émergent. Ils protègent contre plusieurs sources potentielles d'erreur, telles que les différences de style d'écriture personnel et les différences de genre. Dans le même temps, il peut être difficile de généraliser sur la base de résultats provenant d'un seul individu.
"Jack Grieve et ses collègues ont mené plusieurs petites études similaires à l'étude de Jayson Blair et ils ont conclu que les gens mentent de différentes manières", souligne Alvestad.
Un auteur échoue souvent à produire suffisamment de texte. Alors que les textes de Jayson Blair atteignent un total de 80 pages, les spécialistes du machine learning préfèrent travailler avec des collections de textes bien plus volumineuses que cela. Les chercheurs ont donc choisi de combiner des ensembles de textes écrits par un même auteur avec des textes écrits par des auteurs différents, qu'ils collectent auprès de services de fact-checking.
Alvestad et ses collègues ont fait de bons progrès dans l'analyse du langage des fausses nouvelles en anglais, tandis que le norvégien et le russe présentent des défis méthodologiques.
"Alors que l'anglais est la langue la plus couramment utilisée en ligne et a fait l'objet de la plupart des recherches, il est difficile de trouver suffisamment de matériel en norvégien. La Norvège figure en tête de liste des études sur la confiance dans les médias, ce n'est donc pas surprenant. ."
Néanmoins, les chercheurs ont quelques exemples de fausses nouvelles d'auteurs individuels qui ont également écrit de vrais articles avec lesquels ils peuvent faire des comparaisons, et ils collaborent avec le service norvégien de vérification des faits Faktisk.no afin de collecter un plus grand nombre de textes.
"Cette dernière prend beaucoup de temps, car aucun des services de fact-checking avec lesquels nous avons été en contact n'a d'archives qu'il peut partager avec nous. Il faut donc retrouver le chemin du texte original qui a souvent été modifié ou supprimé après que les faits réels ont été vérifiés. Nous voulons bien sûr examiner ces articles tels qu'ils étaient avant que leurs faits ne soient vérifiés », déclare Alvestad.
Difficile de vérifier les sources dans les fake news russes
Il est bien documenté que les mensonges abondent dans les médias russes. Pourtant, il est difficile pour Alvestad et ses collègues de trouver des textes russes qu'ils peuvent utiliser comme matériel de recherche.
"Par exemple, il serait intéressant d'enquêter sur l'impact des informations russes avant l'invasion de l'Ukraine", explique Alvestad.
Cependant, une telle étude présente un certain nombre de défis.
"Tout d'abord, il est devenu très difficile pour les journalistes en Russie d'écrire quelque chose qui s'écartait de la version de la réalité des autorités. Par conséquent, les textes ressemblent plus à des communiqués de presse qu'à des articles de presse et il manque souvent les noms des auteurs. Nous voulons d'inclure les noms et les sources des auteurs afin que nous puissions également trouver des textes avec lesquels nous pouvons comparer les textes trompeurs."
De plus, les services de vérification des faits en Russie sont quelque peu différents de ceux de pays comme la Norvège.
"En Russie, il est interdit de diffuser de fausses nouvelles sur certains sujets, mais leur définition des fausses nouvelles n'est pas tout à fait la même que la nôtre."
Afin de trouver du bon matériel en russe, les chercheurs se tournent maintenant vers des services de vérification des faits et des médias basés en dehors de la Russie, tels que l'Ukrainien stopfake.org.
De meilleurs outils pour découvrir les fausses informations
La plate-forme de médias sociaux Facebook utilise actuellement l'intelligence artificielle pour avertir d'une éventuelle désinformation. Si les choses se passent comme l'espèrent les chercheurs du projet Fakespeak, ces outils pourraient être améliorés.
"Voici comment nous travaillons :d'abord, les linguistes travaillant sur le projet analysent les textes. Ensuite, ils transmettent les résultats aux informaticiens, qui intègrent les caractéristiques linguistiques dans les outils existants. Le but est de s'assurer que les fausses nouvelles peut être détecté plus rapidement que ce qui est possible pour le moment."
Vos résultats seront-ils pertinents pour d'autres langues ?
"Si le projet Fakespeak découvre qu'il existe des caractéristiques communes dans les trois langues que nous étudions, ce serait une découverte intéressante. Cependant, ce ne sont que les langues indo-européennes - il existe de nombreuses autres familles de langues. Nous aurons besoin de beaucoup plus études pour pouvoir dire quelque chose sur le caractère universel de ces traits. »
Alvestad rapporte qu'il y a un grand intérêt pour la recherche Fakespeak à la fois à l'intérieur et à l'extérieur du monde universitaire et qu'elle reçoit souvent des demandes de chercheurs qui souhaitent collaborer. Elle souligne la valeur des chercheurs collaborant étroitement entre les disciplines et les institutions d'une manière qui génère de nouvelles connaissances.
"Nous sommes en fait un exemple de projet interdisciplinaire qui rend la recherche en sciences humaines très utile à la société", conclut-elle. + Explorer plus loin Les canulars du poisson d'avril pourraient fournir des indices pour aider à identifier les "fausses nouvelles"