• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Améliorer la réponse aux catastrophes grâce aux données Twitter

    « Nous regardons la crise telle qu’elle se produit, », a déclaré Prasenjit Mitra. « La meilleure source pour obtenir des informations en temps opportun lors d'une catastrophe sont les médias sociaux, en particulier les microblogs comme Twitter. Crédit :Thinkstock

    Les données de Twitter pourraient fournir aux équipes de secours en cas de catastrophe des informations en temps réel pour fournir de l'aide et sauver des vies, grâce à un nouvel algorithme développé par une équipe internationale de chercheurs.

    Une équipe de chercheurs de Penn State, l'Institut indien de technologie de Kharagpur, et le Qatar Computing Research Institute a créé un algorithme qui analyse les données de Twitter pour identifier les petits événements liés aux catastrophes, appelés sous-événements, et générer très précis, des résumés en temps réel qui peuvent être utilisés pour guider les activités d'intervention.

    Le groupe a présenté son article - "Identifying Sub-events and Summarizing Information from Microblogs during Disasters" - aujourd'hui (10 juillet) à la 41e International Association for Computing Machinery's Special Interest Group on Information Retrieval Conference on Research and Development in Information Retrieval à Ann Arbor , Michigan.

    "Nous regardons la crise telle qu'elle se produit, " dit Prasenjit Mitra, doyen associé pour la recherche au Collège des sciences et technologies de l'information de Penn State et contributeur à l'étude.

    « La meilleure source pour obtenir des informations en temps opportun lors d'une catastrophe sont les médias sociaux, en particulier les microblogs comme Twitter, " a déclaré Mitra. " Les journaux n'ont pas encore été imprimés et les blogs n'ont pas encore publié, Twitter permet donc une vue en temps quasi réel d'un événement parmi ceux qui en sont impactés."

    L'analyse de ces données et leur utilisation pour générer des rapports liés à un sous-thème d'une catastrophe, comme les dommages aux infrastructures ou les besoins en abris, pourraient aider les organisations humanitaires à mieux répondre aux besoins variés des individus dans une zone touchée.

    Compte tenu du volume de données produites, gérer manuellement ce processus au lendemain d'une crise n'est pas toujours pratique. Il y a aussi souvent un besoin de mises à jour uniques liées à des sujets particuliers au sein et entre les organisations.

    "Plusieurs travaux sur la synthèse spécifique aux catastrophes ces derniers temps ont proposé des algorithmes qui fournissent pour la plupart un résumé général de l'événement dans son ensemble, " les chercheurs ont écrit dans leur article. " Cependant, différents intervenants comme les secouristes, organismes gouvernementaux, experts de terrain, [et] les gens ordinaires ont des besoins d'information différents."

    Dans l'étude, le groupe a collecté plus de 2,5 millions de tweets publiés lors de trois catastrophes mondiales majeures :le typhon Hagupit qui a frappé les Philippines en 2014, les inondations de 2014 au Pakistan, et le tremblement de terre de 2015 au Népal. Puis, des volontaires du Bureau des Nations Unies pour la coordination des affaires humanitaires ont formé un système d'apprentissage automatique en catégorisant manuellement les tweets en différents sous-événements, comme la nourriture, la médecine et les infrastructures.

    Une fois que le système peut identifier les tweets avec un haut niveau de précision, les chercheurs permettent au système de catégoriser de grandes quantités de données rapidement et avec précision sans intervention humaine. Au fur et à mesure des événements, cependant, de nouvelles catégories de contenu apparaissent qui nécessitent le redémarrage du processus.

    "À un certain point, il y a une dérive dans le sujet. Les sujets passent de la réponse immédiate, comme les gens sont piégés, aux retombées continues, comme des maladies ou des problèmes de transport, " expliqua Mitra. " Quand le sujet change, nous observons la précision de la machine. S'il descend en dessous d'un certain seuil, le groupe de travail catégorise manuellement plus de tweets pour mieux éduquer la machine."

    Leur algorithme "Dependency-Parser-based SUB-event detection", connu sous le nom de DEPSUB, identifié des paires nom-verbe représentant des sous-thèmes, tels que « l'effondrement d'un pont » ou « une personne piégée », et les a classés en fonction de leur fréquence d'apparition dans les tweets. Puis, ils ont créé un algorithme pour rédiger des résumés sur l'événement général et les sous-événements identifiés. Finalement, les évaluateurs humains ont classé l'utilité et l'exactitude des sous-événements identifiés par DEPSUB et des résumés générés automatiquement par rapport à ceux créés par d'autres méthodes existantes.

    Les évaluateurs ont trouvé à la fois DEPSUB et leur algorithme de résumé plus pertinents, utile et compréhensible par rapport à d'autres algorithmes de premier plan. À l'avenir, les chercheurs espèrent appliquer leurs travaux à des situations spécialisées, comme résumer les informations sur les personnes disparues, et extraire des informations spécifiques des tweets qui pourraient créer une description et une visualisation plus approfondies d'un événement.

    "Avec un système bien rodé, aucune intervention humaine n'est nécessaire pour catégoriser ou résumer les données Twitter, " a déclaré Mitra. " Ce système automatisé est une première étape pour donner aux travailleurs humanitaires un échafaudage qu'ils peuvent affiner pour construire un meilleur résumé global d'un événement, ainsi que d'avoir une vision plus étroite d'une partie de cet événement plus vaste."


    © Science https://fr.scienceaq.com