Crédit :PIXABAY
Pour aider les gens à repérer les fausses nouvelles, ou créer une technologie capable de détecter automatiquement les contenus trompeurs, les chercheurs doivent d'abord savoir exactement ce qu'est une fake news, selon une équipe de chercheurs de Penn State. Cependant, ils ajoutent, ce n'est pas aussi simple qu'il y paraît.
"Il y a une vraie crise dans notre compréhension culturelle du terme 'fake news, ' à tel point que plusieurs chercheurs se sont activement éloignés de cette étiquette parce que c'est tellement boueux, déroutant et militarisé par certaines sources partisanes, " a déclaré S. Shyam Sundar, James P. Jimirro Professeur de Media Effects et co-directeur du Media Effects Research Laboratory au Donald P. Bellisario College of Communications.
Dans une étude, les chercheurs ont réduit une myriade d'exemples de fausses nouvelles à sept catégories de base, qui incluent les fausses nouvelles, contenu polarisé, satire, fausses déclarations, commentaire, information persuasive et journalisme citoyen. Les chercheurs ont également comparé ces types de contenu avec de vraies nouvelles et rapportent leurs conclusions dans le numéro actuel de Scientifique américain du comportement .
Les chercheurs ont découvert que les vraies nouvelles ont des caractéristiques de message qui les différencient des différentes catégories de fausses nouvelles, comme l'adhésion au style journalistique. Les fausses nouvelles ont tendance à être moins grammaticales et moins factuelles, avec une plus grande confiance dans les réclamations chargées d'émotion, titres trompeurs et ainsi de suite. Ils diffèrent également par les types de sources qu'ils utilisent et la manière dont ils les utilisent.
En outre, l'étude a relevé des différences dans la structure du site, telles que l'utilisation d'adresses Web non standard et d'e-mails personnels dans la section « nous contacter ». Par ailleurs, les différences de réseau peuvent être utilisées pour aider à les distinguer, avec des nouvelles fabriquées qui circulent principalement parmi les comptes de médias sociaux et impliquent rarement les médias grand public.
Selon Maria Molina, un doctorant en communication de masse et auteur principal de l'article, identifier les différents messages, la source, les caractéristiques structurelles et de réseau des différentes formes d'actualités en ligne sont nécessaires non seulement pour aider les gens à repérer les fausses nouvelles, mais aussi pour aider les scientifiques qui utilisent l'intelligence artificielle (IA) à construire des systèmes qui pourraient un jour alerter automatiquement les gens sur un contenu qui pourrait être de la désinformation.
"Dans notre propre environnement médiatique, nous recevons de nombreux types de contenus différents, mais tous ne sont pas destinés à informer. Cependant, ils apparaissent tous dans le même format, il est donc facile pour les gens de les confondre avec de vraies nouvelles, " dit Molina. " Et, afin de détecter automatiquement les fake news, nous devons d'abord comprendre exactement ce qu'est une fake news et quelles sont les différentes couches, afin que nous puissions classer un contenu comme faux par rapport à un autre contenu."
Les chercheurs ont utilisé une technique de recherche appelée explication de concept pour entreprendre l'étude. Le processus demande aux chercheurs de mener des recherches exhaustives de références à des concepts, dans ce cas, fausses nouvelles, dans les médias savants et populaires. Les chercheurs ont ensuite examiné comment les fausses nouvelles sont définies et comment elles sont mesurées.
Le contenu d'actualités en ligne peut également manquer de nombreux indices structurels autrefois utilisés par les formes de médias plus traditionnelles qui aidaient les gens à mieux différencier les différentes formes de contenu. Par exemple, commentaire est paru une fois dans la section éditoriale d'un article qui signalait que l'article était une opinion. En outre, les publicités peuvent avoir été placées dans une boîte pour la séparer du contenu de l'actualité, dit Sundar, qui est également affilié à l'Institute for Computational and Data Sciences (ICDS) de Penn State, qui fournit à la faculté de Penn State des ressources de calcul intensif.
Les chercheurs suggèrent qu'une meilleure compréhension des différentes formes de fausses et vraies nouvelles pourrait conduire à un meilleur étiquetage du contenu, ce qui pourrait aider à restaurer une partie de cette segmentation des nouvelles. Si le contenu est correctement étiqueté, les consommateurs d'actualités en ligne peuvent avoir des réactions différentes face à différentes formes d'actualités et d'informations, selon Sundar.
"Par exemple, si un élément de contenu est étiqueté comme une actualité directe, alors c'est une autre histoire alors si c'est étiqueté commentaire, ou la satire, " dit-il. " Alors, nous pensons qu'il est très important de reconnaître les différents éléments de l'actualité en ligne pour pouvoir calibrer les attentes des lecteurs et aussi de certaines personnalités publiques qui accusent les médias de falsifier l'information."
L'utilisation d'ordinateurs pour détecter automatiquement les fausses nouvelles est difficile car ces systèmes ne voient le contenu que comme vrai ou faux, dit Dongwon Lee, chercheur principal du projet et professeur agrégé au Collège des sciences et technologies de l'information. Lee, qui est également affilié à ICDS, dit que ce n'est pas toujours le cas.
« Lorsque nous rencontrons du contenu dans la vraie vie, la situation est beaucoup plus compliquée et trouble, " dit Lee. " Par exemple, malgré le fait qu'elles contiennent des informations factuellement incorrectes, un article satirique ne doit pas être aveuglément étiqueté comme faux si le contexte est clair; encore, à la fois, si seulement certaines parties de l'article de satire sont utilisées, hors contexte, dans les réseaux sociaux, alors il devrait être étiqueté comme faux pour freiner sa propagation."
Il a ajouté que les résultats de cette étude pourraient être utilisés pour développer des techniques d'IA capables d'identifier plusieurs types de fausses nouvelles, qui reflétera mieux l'environnement des nouvelles du monde réel.
« Notre meilleure compréhension, dans cet article, des caractéristiques de sept sous-types du spectre des vraies fausses nouvelles nous permettra de développer un nouveau type de système d'auto-détection capable de jugements plus fins, ", a déclaré Lee. "Nous développons actuellement une telle solution en utilisant la technique d'apprentissage supervisé multinomial en apprentissage automatique."