Crédit :CC0 Domaine public
L'étude des reportages sur les canulars du poisson d'avril pourrait offrir des indices pour repérer les articles de «fausses nouvelles», une nouvelle recherche révèle.
Des experts universitaires en traitement du langage naturel de l'Université de Lancaster qui s'intéressent à la tromperie ont comparé le langage utilisé dans les canulars écrits du poisson d'avril et les fausses nouvelles.
Ils ont découvert qu'il existe des similitudes dans la structure écrite des canulars humoristiques du poisson d'avril - les articles parodies publiés par les médias chaque 1er avril - et des fausses nouvelles malveillantes.
Les chercheurs ont compilé un nouvel ensemble de données, ou corpus, de plus de 500 articles sur le poisson d'avril provenant de plus de 370 sites Web et écrits sur 14 ans.
"Les canulars du poisson d'avril sont très utiles car ils nous fournissent un corpus vérifiable de textes trompeurs qui nous donnent l'occasion de découvrir les techniques linguistiques utilisées lorsqu'un auteur écrit quelque chose de fictif déguisé en récit factuel, " a déclaré Edward Dearden de l'Université de Lancaster, et auteur principal de la recherche. "En examinant le langage utilisé dans le poisson d'avril et en le comparant avec de fausses nouvelles, nous pouvons avoir une meilleure idée des types de langage utilisés par les auteurs de désinformation."
Une comparaison des textes canulars du poisson d'avril avec de véritables articles de presse écrits à la même période, mais non publiés le 1er avril, a révélé des différences stylistiques.
Les chercheurs se sont concentrés sur des caractéristiques spécifiques des textes, tels que la quantité de détails utilisés, imprécision, formalité du style d'écriture et complexité de la langue.
Ils ont ensuite comparé les histoires du poisson d'avril avec un ensemble de données de « fausses nouvelles », préalablement compilées par une autre équipe de chercheurs.
Bien que toutes les fonctionnalités trouvées dans les canulars du poisson d'avril ne se soient pas révélées utiles pour détecter les fausses nouvelles, il y avait un certain nombre de caractéristiques similaires dans les deux.
Ils ont découvert que les canulars du poisson d'avril et les faux articles de presse ont tendance à contenir un langage moins complexe, une difficulté de lecture plus facile, et des phrases plus longues que les vraies nouvelles.
Détails importants pour les nouvelles, comme des noms, des endroits, dates et heures, se sont avérés être utilisés moins fréquemment dans les canulars du poisson d'avril et les fausses nouvelles. Cependant, noms propres, tels que les noms d'éminents politiciens « Trump » ou « Hillary », sont plus abondants dans les fake news que dans les vrais articles de presse ou les poissons d'avril, qui en ont nettement moins.
Les pronoms à la première personne, comme « nous », sont également une caractéristique importante pour les poissons d'avril et les fausses nouvelles. Cela va à l'encontre de la pensée traditionnelle en matière de détection de tromperie, ce qui suggère que les menteurs utilisent moins de pronoms à la première personne.
Les chercheurs ont découvert que les histoires de canular du poisson d'avril, par rapport aux nouvelles authentiques :
Fausses nouvelles, par rapport aux nouvelles authentiques :
Les chercheurs ont également créé un « classificateur » d'apprentissage automatique pour identifier si les articles sont des canulars du poisson d'avril, de fausses nouvelles ou de véritables reportages. Le classificateur a atteint une précision de 75 % pour identifier les articles du poisson d'avril et de 72 % pour identifier les fausses nouvelles. Lorsque le classificateur a été formé sur les canulars du poisson d'avril et s'est chargé d'identifier les fausses nouvelles, il a enregistré une précision de plus de 65%.
Dr Alistair Baron, co-auteur de l'article, a déclaré : « Il est essentiel d'examiner les détails et les complexités d'un texte lorsqu'il s'agit de déterminer si un article est un canular. Bien qu'il existe de nombreuses différences, nos résultats suggèrent que le poisson d'avril et les faux articles de nouvelles partagent des caractéristiques similaires, impliquant principalement une complexité structurelle.
"Nos résultats suggèrent qu'il existe certaines caractéristiques communes entre différentes formes de désinformation et l'exploration de ces similitudes peut fournir des informations importantes pour de futures recherches sur les nouvelles trompeuses."
La recherche a été décrite dans l'article " Fool's Errand:Looking at April Fools Hoaxes as Disinformation through the Lens of Deception and Humour ", qui sera présenté à la 20e Conférence internationale sur la linguistique informatique et le traitement de texte intelligent, qui se tiendra à La Rochelle en avril.