• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Des algorithmes révèlent des modèles pour aider à lutter contre les fausses nouvelles

    Crédit :Université de Californie - Riverside

    En février, le ministère de la Justice a accusé 13 Russes d'avoir volé l'identité de citoyens américains et diffusé de « fausses nouvelles » dans l'intention de renverser la dernière élection présidentielle américaine. L'affaire est toujours en cours, et peut le faire pendant des années. En attendant, Les chercheurs de l'UCR ont mis au point une solution technologique pour la diffusion de fausses informations malveillantes.

    Le laboratoire de données multi-aspects de l'UCR, dirigé par Evangelos E. Papalexakis, professeur assistant au département d'informatique et d'ingénierie, développe de nouvelles techniques de science des données pour résoudre une variété de problèmes dans l'analyse des réseaux sociaux, avec le financement du Naval Sea Systems Command, Consortium de formation en génie naval, la Fondation nationale des sciences, et Adobe.

    Les chercheurs élaborent des algorithmes pour discerner des modèles qui indiquent des « fausses nouvelles ». Par extrapolation, et commandes insérées dans les systèmes de gestion de contenu des éditeurs, ces éléments peuvent ensuite être supprimés avant qu'ils ne soient mis en ligne et causent des ravages. Surtout, le calcul DUC peut enregistrer l'« empreinte » de ces postes à l'appui des poursuites.

    Le dernier article académique de Papalexakis sur ce travail :"Unsupervised Content-Based Identification of Fake News Articles with Tensor Decomposition Ensembles, " co-écrit avec l'assistant de recherche diplômé Seyed Mehdi Hosseini Motlagh, a été présenté, et a remporté le « prix du meilleur article », " lors du récent atelier MIS2:Misinformation and Misbehavior Mining on the Web, dans le cadre du WSDM 2018 (11th ACM International Conference on Web Search and Data Mining).

    "Des études antérieures ont fourni des informations utiles sur la propagation d'un article dans un réseau social. Cependant, la détection basée uniquement sur cela présente le risque qu'un faux article d'information « infecte » un certain nombre d'utilisateurs de médias sociaux avant qu'il ne soit détecté, " a déclaré Papalexakis. " Au lieu de cela, notre travail vise à la détection précoce de tels articles, surtout dans les cas où nous n'avons aucune connaissance externe concernant la validité et la véracité d'un article."

    La surveillance du réseau humain repose sur une combinaison de bon sens et d'expérience pour savoir si quelque chose est légitime. Par exemple, les modérateurs vérifient si le titre est en MAJUSCULES (code digi-culture pour "crier"), utiliser des mots-clés de langage de crimes haineux bien connus, et recherchez un manque de sources vérifiées pour les allégations fallacieuses.

    Mais comment apprendre à un ordinateur que ces attributs triangulés indiquent souvent des « fausses nouvelles » ?

    La compréhension basée sur la machine repose uniquement sur des concepts mathématiques, Papalexakis et ses chercheurs utilisent donc ce qu'on appelle des « données multi-aspects ». Tout simplement, imaginez un groupe social dans lequel tout le monde à l'intérieur de l'interaction a de nombreuses façons de se connecter (par exemple, téléphone, texte, vidéo, message instantané, publications sur les réseaux sociaux). Le Multi-Aspect Data Lab enregistre ensuite, examine, catégorise et modélise toutes ces entrées, sur la base de ce que l'on appelle les "décompositions tensorielles". Un "tenseur" en science des données signifie une structure multidimensionnelle, comme un cube. Tous les aspects multiples sont capturés numériquement sous forme de cubes multidimensionnels afin que le système puisse enquêter et « comprendre » ce qui se passe réellement, et si les nouvelles sont fausses, ou pas.

    « Les techniques de décomposition tensorielle que nous développons sont capables de capturer des modèles nuancés qui identifient avec succès différentes catégories de fausses nouvelles, sans utiliser aucune connaissance externe sur la validité d'un article particulier », a déclaré Papalexakis.

    En tirant parti de la diversité de tous les aspects des données, le système UCR fournit un résultat plus précis que les recherches publiées antérieurement dans ce domaine. Dans leur papier, les auteurs illustrent comment ils compilent leur algorithme, puis publier les résultats de plusieurs expériences, démontrant que l'algorithme proposé a identifié jusqu'à 80 pour cent des fausses nouvelles.

    L'industrie a pris note. Papalexakis a déclaré qu'il poursuivait activement des collaborations avec les principaux géants de la technologie.


    © Science https://fr.scienceaq.com