• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Le modèle fusionne les médias sociaux, données de télédétection dans le but d'identifier les menaces nucléaires

    Crédit :CC0 Domaine public

    Un nouveau modèle informatique permet aux chercheurs de s'appuyer sur des ensembles de données normalement incompatibles, telles que les images satellite et les publications sur les réseaux sociaux, pour répondre aux questions sur ce qui se passe dans des endroits ciblés. Les chercheurs ont développé le modèle pour servir d'outil pour identifier les violations des accords de non-prolifération nucléaire.

    « Notre objectif était de développer un cadre de travail qui utilise des informations provenant d'une variété de capteurs et de sources de données pour identifier ces violations potentielles de la non-prolifération nucléaire, " dit Hamid Krim, co-auteur d'un article sur l'œuvre, professeur de génie électrique et informatique à la North Carolina State University et directeur du laboratoire VISSTA. "Certaines de ces données peuvent être conventionnelles, telles que les lectures du compteur Geiger ou les données multispectrales de l'imagerie satellitaire. Mais bon nombre de ces sources de données peuvent être non traditionnelles, comme les publications sur les réseaux sociaux. Et ces sources fournissent une grande variété de données qui ne sont normalement pas compatibles, tels que le texte inclus sur les publications Twitter et les images publiées sur Flickr.

    « En rendant ces différentes entrées compatibles entre elles, nous sommes en mesure d'accepter un plus large éventail d'entrées de données et d'utiliser ces données d'une manière significative qui, finalement, peut aider les autorités à tirer des conclusions plus fiables, " dit Krim.

    Les chercheurs affirment que le modèle peut être utilisé pour travailler avec toutes les données pouvant être identifiées comme provenant de la zone ciblée. Par exemple, les images satellites sont clairement identifiables, mais ils peuvent également s'appuyer sur des publications sur les réseaux sociaux qui sont activement ou passivement étiquetées comme provenant du domaine concerné.

    La question devient alors :comment travaillez-vous avec des données incompatibles ? Expliquer, nous utiliserons un problème de proxy que les chercheurs ont utilisé dans leur article :identifier une inondation. Ils ont choisi une crue car les données sur les crues ne sont pas classifiées, alors que les données concernant l'activité nucléaire le sont.

    La première étape du processus consiste à utiliser des équations mathématiques pour traduire chaque type de données dans un format utile. Par exemple, les images peuvent être passées à travers des modèles pour déterminer s'il s'agit d'images d'inondations, tandis que les messages texte peuvent être passés à travers des modèles pour déterminer s'ils incluent des références aux inondations. Une fois que ces flux de données sont traduits dans un format neutre - ce qui signifie qu'ils indiquent une inondation ou aucune inondation - ils peuvent être comparés les uns aux autres pour répondre à des questions de base telles que :les données se soutiennent-elles ?

    Mais ce n'est pas si simple. Par exemple, les gens peuvent tweeter à propos d'une inondation qui se déroule à des centaines de kilomètres, ce qui pourrait fausser tout calcul du modèle global. Pour remédier à ce, les chercheurs ont incorporé des éléments mathématiques qui rendent compte de la complexité des données sur lesquelles ils s'appuient.

    « S'attaquer à la complexité est particulièrement important dans le contexte de l'application de la non-prolifération, " dit Krim. " Les entrées de données pertinentes peuvent inclure des photos de types particuliers de technologie, références faites dans des conversations captées sur audio, etc. Un modèle comme celui que nous avons développé doit être suffisamment flexible pour tenir compte de la variabilité et de la complexité des types de données variés et des indices variés que nous recherchons. »

    Les chercheurs ont testé leur modèle en utilisant les données d'une inondation de 2013 qui a eu lieu dans le Colorado, et ont pu résoudre l'incompatibilité des données multimodales afin d'estimer avec précision la localisation de l'inondation.

    Les prochaines étapes du projet comprennent l'évaluation des installations nucléaires dans l'Ouest afin d'identifier les caractéristiques communes qui peuvent également être applicables aux installations dans les sociétés plus isolées, comme la Corée du Nord.

    "Nous voulons trouver des moyens de transférer des informations d'un environnement connu vers un environnement caché, " dit Krim. " Comment pouvons-nous déterminer quelles informations et quels modèles sont transférables d'un endroit à un autre, donné des données incompatibles ou incohérentes ? Qu'est-ce qui est normal, et qu'est-ce qui ne l'est pas ? Ce n'est pas un problème facile."


    © Science https://fr.scienceaq.com