Crédit :Jean-Gabriel Young
Deux membres de la famille sont testés positifs pour COVID-19 :comment savoir qui a infecté qui ? Dans un monde parfait, la science des réseaux pourrait fournir une réponse probable à de telles questions. Il pourrait également dire aux archéologues comment un tesson de poterie grecque a été trouvé en Égypte, ou aider les biologistes de l'évolution à comprendre comment un ancêtre disparu depuis longtemps métabolisait les protéines.
Comme le monde est, les scientifiques disposent rarement des données historiques dont ils ont besoin pour voir exactement comment les nœuds d'un réseau se sont connectés. Mais un nouvel article publié dans Lettres d'examen physique offre l'espoir de reconstruire les informations manquantes, en utilisant une nouvelle méthode pour évaluer les règles qui génèrent des modèles de réseau.
"Les modèles de réseau sont comme des images impressionnistes des données, " dit le physicien George Cantwell, l'un des auteurs de l'étude et chercheur postdoctoral au Santa Fe Institute. "Et il y a eu un certain nombre de débats pour savoir si les vrais réseaux ressemblent suffisamment à ces modèles pour que les modèles soient bons ou utiles."
Normalement, lorsque les chercheurs essaient de modéliser un réseau en pleine croissance, disons, un groupe d'individus infectés par un virus - ils construisent le réseau modèle à partir de zéro, en suivant un ensemble d'instructions mathématiques pour ajouter quelques nœuds à la fois. Chaque nœud pourrait représenter un individu infecté, et chaque bord une connexion entre ces individus. Lorsque les clusters de nœuds du modèle ressemblent aux données tirées des cas réels, le modèle est considéré comme représentatif, une hypothèse problématique lorsqu'un même modèle peut résulter de différents ensembles d'instructions.
Cantwell et co-auteurs Guillaume St-Onge (Université Laval, Québec) et Jean-Gabriel Young (Université du Vermont) ont voulu apporter une touche de rigueur statistique au processus de modélisation. Au lieu de comparer les caractéristiques d'un instantané du modèle de réseau avec les caractéristiques des données du monde réel, ils ont développé des méthodes pour calculer la probabilité de chaque histoire possible pour un réseau en croissance. Étant donné des ensembles de règles concurrentes, qui pourraient représenter des processus du monde réel tels que le contact, gouttelette, ou la transmission aéroportée, les auteurs peuvent appliquer leur nouvel outil pour déterminer la probabilité que des règles spécifiques aboutissent au modèle observé.
"Au lieu de simplement demander 'cette image ressemble-t-elle plus à la vraie chose?'", dit Cantwell, "Nous pouvons maintenant poser des questions matérielles comme, « a-t-il grandi selon ces règles ? » Une fois le modèle de réseau le plus probable trouvé, il peut être rembobiné pour répondre à des questions telles que qui a été infecté en premier.
Dans leur article actuel, les auteurs démontrent leur algorithme sur trois réseaux simples qui correspondent à des ensembles de données précédemment documentés avec des histoires connues. Ils travaillent maintenant à appliquer l'outil à des réseaux plus complexes, qui pourraient trouver des applications dans un certain nombre de systèmes complexes.