Architecture globale pour le réseau de neurones convolutifs (CNN). Crédit :Singh et Kumar.
Chercheurs de l'Institut National de Technologie de Patna, en Inde, ont récemment mis au point un outil pour identifier la localisation géographique des situations d'urgence et des catastrophes, ainsi que celle des personnes qui y participent. Leur approche, décrit dans un article de la Revue internationale de réduction des risques de catastrophe , extrait les informations de localisation des tweets à l'aide d'un modèle basé sur un réseau neuronal convolutif (CNN).
« En cas d'urgence, les informations de localisation géographique des événements, ainsi que celui des utilisateurs concernés, sont d'une importance vitale, " Jyoti Prakash Singh, l'un des chercheurs qui a mené l'étude, a déclaré TechXplore. « Identifier cette situation géographique est une tâche difficile, car les champs de localisation disponibles tels que la localisation de l'utilisateur et le nom de lieu des tweets ne sont pas fiables. La localisation GPS précise des utilisateurs est rare dans les tweets, et aussi parfois incorrectes en termes d'informations spatio-temporelles."
Les personnes touchées par des catastrophes naturelles ou d'autres situations d'urgence partagent souvent leur emplacement sur les réseaux sociaux, demander de l'aide. Ces informations pourraient aider les unités d'intervention et les autorités locales à détecter précocement les événements, localiser les victimes et les aider. Cependant, l'extraction de données liées à la localisation à partir de tweets est une tâche très difficile, car ceux-ci sont souvent écrits dans un anglais non standard et contiennent des erreurs grammaticales, fautes d'orthographe ou abréviations.
"Il est presque impossible pour les opérateurs humains qui suivent les tweets de parcourir chaque tweet et de trouver les informations de localisation qui y sont mentionnées, " a déclaré Singh. "Cela nous a motivés à développer une solution pour extraire automatiquement les informations de localisation des tweets demandant de l'aide. Dans ce travail, nous avons utilisé l'apprentissage en profondeur pour déterminer si un tweet contient des noms de lieux et mettre ces mots en évidence."
Singh et son collègue Abhivan Kumar ont développé un modèle CNN qui peut identifier l'emplacement des utilisateurs en analysant le contenu de leurs tweets. Ils ont choisi cette approche d'apprentissage en profondeur spécifique car elle peut automatiquement apprendre la meilleure représentation des données d'entrée et l'utiliser pour identifier les références de localisation.
"Nous avons utilisé une technique d'incorporation de mots pour représenter les tweets dans la couche d'entrée du CNN et les références de localisation présentes dans le tweet sont représentées dans la couche de sortie sous la forme d'un vecteur zéro-un, " expliqua Singh. " Les mots de localisation sont codés comme 1 et les mots non localisés sont codés comme 0. Nous avons utilisé plusieurs combinaisons de 2 grammes, 3 grammes, 4 grammes, et des filtres de 5 grammes pour extraire les caractéristiques du tweet. Après une formation pour le modèle pour les 100 époques, il est capable de prédire les références de localisation mentionnées dans le tweet avec une précision impressionnante."
Dans une première évaluation, le modèle CNN conçu par Singh et Kumar a pu extraire tous les mots liés à la localisation des tweets avec une très grande précision, même lorsque le texte d'un tweet était bruyant. Les chercheurs ont testé leur modèle sur des tweets qui n'avaient pas été prétraités et contenaient des erreurs grammaticales, fautes de frappe, abréviations, et d'autres facteurs de confusion.
"La principale implication pratique de notre travail est qu'il peut être facilement mis en pipeline, en utilisant des modèles de détection d'événements, ", a déclaré Singh. "Les modèles de détection d'événements peuvent identifier les tweets liés à ladite catastrophe et notre modèle peut extraire l'emplacement des victimes touchées par cette catastrophe."
À l'avenir, le modèle CNN développé par les chercheurs pourrait aider à localiser rapidement les événements d'urgence et les personnes nécessitant une assistance urgente. La même approche pourrait également être appliquée aux troubles civils, Publicité ciblée, observer le comportement humain régional, gestion du trafic routier en temps réel et autres services basés sur la localisation.
"Dans ce travail, nous n'avons considéré que les tweets en anglais, mais pendant une crise, les utilisateurs publient également des tweets dans leurs langues régionales, " a déclaré Singh. "Nous travaillons donc sur un modèle qui répond à cette limitation multilingue, tout en essayant de développer un modèle semi-supervisé pour réduire le problème de l'étiquetage des données."
© 2018 Réseau Science X