Pour identifier les fausses nouvelles, Le nouvel outil d'apprentissage automatique de Fraunhofer FKIE analyse à la fois le texte et les métadonnées. Crédit :Fraunhofer FKIE
Histoires inventées, faits déformés :les fausses nouvelles se répandent comme une traînée de poudre sur Internet et sont souvent partagées sans réfléchir, notamment sur les réseaux sociaux. En réponse, Les chercheurs de Fraunhofer ont développé un système qui analyse automatiquement les publications sur les réseaux sociaux, filtrer délibérément les fausses nouvelles et la désinformation. Pour faire ça, l'outil analyse à la fois le contenu et les métadonnées, en le classant à l'aide de techniques d'apprentissage automatique et en s'appuyant sur l'interaction de l'utilisateur pour optimiser les résultats au fur et à mesure.
Les fausses nouvelles sont conçues pour provoquer une réponse spécifique ou inciter à l'agitation contre un individu ou un groupe de personnes. Son objectif est d'influencer et de manipuler l'opinion publique sur des sujets d'actualité ciblés. Cette fausse nouvelle peut se répandre comme une traînée de poudre sur Internet, notamment sur les réseaux sociaux comme Facebook ou Twitter. De plus, l'identifier peut être une tâche délicate. C'est là qu'un outil de classification développé par l'Institut Fraunhofer pour la communication, Traitement de l'information et ergonomie FKIE intervient, analyser automatiquement les publications sur les réseaux sociaux et traiter de grandes quantités de données.
En plus du traitement du texte, l'outil prend également en compte les métadonnées dans son analyse et fournit ses conclusions sous forme visuelle. "Notre logiciel se concentre sur Twitter et d'autres sites Web. Les tweets sont l'endroit où vous trouvez les liens pointant vers les pages Web qui contiennent les fausses nouvelles. En d'autres termes, les réseaux sociaux agissent comme un déclencheur, si tu veux. Les fausses informations sont souvent hébergées sur des sites Web conçus pour imiter la présence Web des agences de presse et peuvent être difficiles à distinguer des sites authentiques. Dans de nombreux cas, ils seront basés sur des faits divers officiels, mais dont le libellé a été modifié, " explique le professeur Ulrich Schade de Fraunhofer FKIE, dont le groupe de recherche a développé l'outil.
Schade et son équipe commencent le processus en créant des bibliothèques composées d'actualités sérieuses et de textes que les utilisateurs ont identifiés comme de fausses nouvelles. Ceux-ci forment ensuite les ensembles d'apprentissage utilisés pour former le système. Pour filtrer les fausses nouvelles, les chercheurs utilisent des techniques d'apprentissage automatique qui recherchent automatiquement des marqueurs spécifiques dans les textes et les métadonnées. Par exemple, dans un contexte politique, il peut s'agir de formulations ou de combinaisons de mots qui apparaissent rarement dans le langage courant ou dans les reportages journalistiques, comme « l'actuel chancelier d'Allemagne ». Les erreurs linguistiques sont également un drapeau rouge. Ceci est particulièrement courant lorsque l'auteur de la fausse nouvelle écrivait dans une langue autre que sa langue maternelle. Dans ces cas, ponctuation incorrecte, orthographe, les formes verbales ou la structure de la phrase sont tous des avertissements d'une fausse nouvelle potentielle. D'autres indicateurs peuvent inclure des expressions déplacées ou des formulations lourdes.
« Lorsque nous fournissons au système un ensemble de marqueurs, l'outil apprendra tout seul à sélectionner les marqueurs qui fonctionnent. Un autre facteur décisif est le choix de l'approche d'apprentissage automatique qui fournira les meilleurs résultats. C'est un processus qui prend beaucoup de temps, parce que vous devez exécuter les différents algorithmes avec différentes combinaisons de marqueurs, " dit Schade.
Les métadonnées fournissent des indices vitaux
Les métadonnées sont également utilisées comme marqueur. En effet, il joue un rôle crucial dans la différenciation entre les sources d'information authentiques et les fausses nouvelles :par exemple, à quelle fréquence les messages sont-ils publiés, quand un tweet est-il programmé, et a quelle heure ? Le timing d'un message peut être très révélateur. Par exemple, il peut révéler le pays et le fuseau horaire de l'auteur de la nouvelle. Une fréquence d'envoi élevée suggère des bots, ce qui augmente la probabilité d'une fausse nouvelle. Les robots sociaux envoient leurs liens à un grand nombre d'utilisateurs, par exemple pour répandre l'incertitude parmi le public. Les connexions et les abonnés d'un compte peuvent également s'avérer un terrain fertile pour les analystes.
En effet, cela permet aux chercheurs de créer des cartes thermiques et des graphiques des données d'envoi, fréquence d'envoi et réseaux suiveurs. Ces structures de réseau et leurs nœuds individuels peuvent être utilisés pour calculer quel nœud du réseau a diffusé un élément de fausses nouvelles ou lancé une campagne de fausses nouvelles.
Une autre caractéristique de l'outil automatisé est sa capacité à détecter les discours de haine. Les messages qui se présentent comme des nouvelles, mais qui incluent également des propos haineux, renvoient souvent à de fausses nouvelles. « L'important est de développer un marqueur capable d'identifier les cas clairs de discours de haine. Les exemples incluent des expressions telles que « racaille politique » ou « nègre », " dit le linguiste et mathématicien.
Les chercheurs sont capables d'adapter leur système à différents types de textes afin de les classer. Les organismes publics et les entreprises peuvent utiliser l'outil pour identifier et combattre les fausses nouvelles. "Notre logiciel peut être personnalisé et formé pour répondre aux besoins de tout client. Pour les organismes publics, cela peut être un système d'alerte précoce utile, " dit Schade.