• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Autres
    Une nouvelle méthode de mesure des dépendances spatiales transforme moins de données en plus de données

    Représentation des interdépendances dans la migration humaine des zones inondables vers les villes de l'intérieur du Bangladesh. Crédit :Maurizio Porfiri, doctorat

    L'identification des migrations humaines induites par le changement climatique, la propagation du COVID-19, tendances agricoles, et les problèmes socio-économiques dans les régions voisines dépendent des données - plus le modèle est complexe, plus il faut de données pour comprendre de tels phénomènes répartis dans l'espace. Cependant, des données fiables sont souvent coûteuses et difficiles à obtenir, ou trop clairsemée pour permettre des prédictions précises.

    Maurizio Porfiri, Professeur de l'Institut de mécanique et aérospatiale, biomédical, et génie civil et urbain et membre du Center for Urban Science and Progress (CUSP) de la NYU Tandon School of Engineering, a conçu une nouvelle solution basée sur la théorie des réseaux et de l'information qui fait que les « petites données » agissent en grand, l'application des techniques mathématiques normalement utilisées pour les séries chronologiques, aux processus spatiaux.

    L'étude, "Une approche théorique de l'information pour étudier les dépendances spatiales dans de petits ensembles de données, " figurait sur la couverture de Proceedings of the Royal Society A:Mathématique, Sciences physiques et de l'ingénierie , décrit comment, à partir d'un petit échantillon d'attributs dans un nombre limité d'emplacements, les observateurs peuvent faire des inférences solides d'influences, y compris des interpolations vers des zones intermédiaires ou même des régions éloignées qui partagent des attributs clés similaires.

    "La plupart du temps, les ensembles de données sont pauvres, " expliqua Porfiri. " Par conséquent, nous avons adopté une approche très basique, appliquer la théorie de l'information pour explorer si l'influence au sens temporel pourrait être étendue à l'espace, ce qui nous permet de travailler avec un très petit ensemble de données, entre 25 et 50 observations, ", a-t-il déclaré. "Nous prenons un instantané des données et établissons des liens - non basés sur la cause et l'effet, mais sur l'interaction entre les points individuels - pour voir s'il existe une forme de sous-jacent, réponse collective dans le système.

    La méthode, développé par Porfiri et son collaborateur Manuel Ruiz Marín du Département des méthodes quantitatives, Droit et Langues Modernes, Université technique de Carthagène, Espagne, impliqué:

    • Consolider un ensemble de données donné en une petite gamme de symboles admissibles, similaire à la façon dont un système d'apprentissage automatique peut identifier un visage avec des données de pixels limitées :un menton, pommettes, front, etc.
    • Appliquer un principe de théorie de l'information pour créer un test non paramétrique (un test qui ne suppose aucun modèle sous-jacent pour l'interaction entre les emplacements) pour établir des associations entre les événements et découvrir si l'incertitude à un emplacement particulier est réduite si l'on a des connaissances sur le l'incertitude dans un autre endroit.

    Professeur Maurizio Porfiri, au travail dans son laboratoire à la NYU Tandon School of Engineering. Crédit:NYU Tandon School of Engineering

    Porfiri a expliqué que puisqu'une approche non paramétrique ne postule aucune structure sous-jacente pour les influences entre les nœuds, il confère une flexibilité dans la façon dont les nœuds peuvent être associés, ou encore comment se définit le concept de voisin.

    "Parce que nous faisons abstraction de ce concept de voisin, nous pouvons le définir dans le cadre de toute qualité que vous aimez, par exemple, idéologie. Idéologiquement, La Californie peut être voisine de New York, bien qu'ils ne soient pas géographiquement co-localisés. Ils peuvent partager des valeurs similaires."

    L'équipe a validé le système par rapport à deux études de cas :les migrations de population au Bangladesh en raison de l'élévation du niveau de la mer et les décès de véhicules à moteur aux États-Unis, pour tirer un aperçu statistique des mécanismes des problèmes socio-économiques importants.

    "Dans le premier cas, nous voulions voir si la migration entre les emplacements pouvait être prédite par la distance géographique ou la gravité de l'inondation de ce district particulier - si la connaissance de quel district est proche d'un autre district ou la connaissance du niveau d'inondation aidera à prédire la taille de la migration, ", a déclaré Ruiz Marin.

    Pour le deuxième cas, ils ont examiné la distribution spatiale des accidents de voiture liés à l'alcool en 1980, 1994, et 2009, comparer les États avec un degré élevé de tels accidents aux États adjacents et aux États ayant des idéologies législatives similaires sur l'alcool au volant.

    "Nous avons découvert une relation plus forte entre les États partageant des frontières qu'entre les États partageant des idéologies législatives concernant la consommation d'alcool et la conduite."

    Prochain, Porfiri et Ruiz Marín envisagent d'étendre leur méthode à l'analyse des processus spatio-temporels, comme la violence armée aux États-Unis - un projet de recherche majeur récemment financé par le programme LEAP HI de la National Science Foundation - ou les crises d'épilepsie dans le cerveau. Leur travail pourrait aider à comprendre quand et où la violence armée peut se produire ou les crises peuvent commencer.


    © Science https://fr.scienceaq.com