• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Le site Web CoronaCheck lutte contre la propagation de la désinformation

    Crédit :CC0 Domaine public

    Les chercheurs de Cornell ont développé un système automatisé qui utilise l'apprentissage automatique, analyse des données et rétroaction humaine pour vérifier automatiquement les affirmations statistiques sur le nouveau coronavirus.

    "CoronaCheck, " sur la base des recherches en cours d'Immanuel Trummer, professeur assistant en informatique, lancé à l'international en mars et a déjà été utilisé plus de 9 600 fois. La base de données—maintenant disponible en anglais, Français et italien :vérifie les allégations sur la propagation du COVID-19 sur la base de sources fiables telles que l'Organisation mondiale de la santé et les Centers for Disease Control and Prevention.

    "Il y a beaucoup trop de désinformation sur le coronavirus sur le Web, c'est assez ahurissant, réellement, ", a déclaré Trummer. "Certaines de ces allégations de désinformation sont inoffensives, mais d'autres, comme « manger de l'argent guérit le coronavirus », peuvent être dangereux."

    Le système CoronaCheck est une collaboration entre l'équipe de Trummer, dont les doctorants Georgios Karagiannis et Saehan Jo, et l'équipe de Paolo Papotti chez Eurecom, une école d'ingénieur à Biot, La France.

    En raison du volume considérable de mauvaises informations sur Internet et de la vitesse à laquelle davantage de désinformation est produite et propagée, il est impossible pour les humains de résoudre le problème en effectuant seuls des vérifications manuelles des faits. Même les approches automatisées courantes, qui tentent généralement de mapper les nouvelles revendications aux vérifications des faits existantes, ne peut pas être mené de manière réaliste à une échelle suffisamment grande pour s'attaquer à la portée de la désinformation, dit Trummer.

    "Nous avons essayé d'automatiser l'ensemble du processus, des données brutes au texte que l'on veut vérifier, ", a déclaré Trummer.

    CoronaCheck adapte "Scrutinizer, " un système Trummer développé avec Eurecom pour l'Agence Internationale de l'Energie à Paris, une organisation non gouvernementale, pour aider les vérificateurs de faits humains à traduire des résumés de texte en équations que l'ordinateur peut comprendre et résoudre. Pour faire ça, Scrutinizer utilise l'apprentissage automatique et le traitement du langage naturel - une branche de l'intelligence artificielle visant à déchiffrer le langage humain - ainsi que de grands ensembles de données qui aident le système à comprendre comment aborder chaque nouvelle réclamation, et les commentaires des utilisateurs humains.

    "Les ordinateurs ont du mal à comprendre le langage naturel, " a-t-il dit. " Nous ne pouvons pas demander directement à l'ordinateur de vérifier si une affirmation dans une phrase est correcte ou non. Nous devons donc essentiellement traduire l'affirmation de notre langue dans un langage de requête que l'ordinateur comprend."

    Par exemple, si quelqu'un tape que le nombre de cas de coronavirus est plus élevé en France qu'en Italie, le système utilise une sorte de processus d'élimination pour affiner les équations possibles pour représenter ce texte. Il s'appuie sur ses ensembles de données pour créer une expression mathématique qui peut comparer l'affirmation aux faits.

    Puis, basé sur l'expérience, le système détermine les meilleures sources pour vérifier la réclamation, s'appuyant sur des données publiques fiables compilées quotidiennement par l'Université Johns Hopkins. Le modèle d'apprentissage automatique du système peut également s'améliorer au fil du temps, apprendre à reconnaître les nouveaux types de réclamations en fonction des commentaires des utilisateurs.

    "Il y a énormément de désinformation et l'ensemble des réclamations que les gens vérifient est assez diversifié, " Trummer a déclaré. "Pour toute réclamation donnée, il existe un très grand nombre d'expressions de requêtes possibles, et notre objectif est de trouver le bon."

    L'interface de la base de données s'appuie sur les travaux connexes de Trummer, y compris AggChecker, le premier outil pour vérifier automatiquement les résumés textuels des ensembles de données en interrogeant une base de données relationnelle. AggChecker a été présenté à la conférence annuelle de l'Association for Computing Machinery's Special Interest Group on Management of Data en 2019.

    Son équipe a également développé une "base anti-connaissance" des erreurs factuelles courantes de Wikipedia en collaboration avec Google NYC. La recherche derrière CoronaCheck a été en partie financée par un Google Faculty Research Award.


    © Science https://fr.scienceaq.com