Les couleurs représentent les identités des nœuds. La ligne du haut indique le nombre de connexions de chaque nœud. Dans le cercle, vous pouvez voir toutes les manières possibles de créer un graphe connecté à partir de ces nœuds. Le nouvel algorithme peut en choisir un de manière aléatoire et répétée. Crédit :Szabolcs Horvat et al. 2020/MPI-CBG/CSBD
De nombreux réseaux naturels et anthropiques, comme un ordinateur, les réseaux biologiques ou sociaux ont une structure de connectivité qui façonne de manière critique leur comportement. Le domaine académique de la science des réseaux s'intéresse à l'analyse de ces réseaux complexes du monde réel et à la compréhension de l'influence de leur structure sur leur fonction ou leur comportement. Des exemples sont le réseau vasculaire de notre corps, le réseau de neurones de notre cerveau, ou le réseau de la façon dont une épidémie se propage à travers une société.
Le besoin de modèles nuls fiables
L'analyse de ces réseaux se concentre souvent sur la recherche de propriétés et de caractéristiques intéressantes. Par exemple, la structure d'un réseau de contacts particulier aide-t-elle les maladies à se propager particulièrement rapidement ? Pour le savoir, nous avons besoin d'une ligne de base - un ensemble de réseaux aléatoires, un soi-disant « modèle nul »—à comparer. Par ailleurs, puisque plus de connexions créent évidemment plus de possibilités d'infection, le nombre de connexions de chaque nœud de la ligne de base doit correspondre au réseau que nous analysons. Ensuite, si notre réseau semble faciliter la diffusion plus que la ligne de base, nous savons que cela doit être dû à sa structure de réseau spécifique. Cependant, créer vraiment aléatoire, impartial, Les modèles nuls qui correspondent à certaines propriétés sont difficiles et nécessitent généralement une approche différente pour chaque propriété d'intérêt. Les algorithmes existants qui créent des réseaux connectés avec un nombre spécifique de connexions pour chaque nœud souffrent tous d'un biais incontrôlé, ce qui signifie que certains réseaux sont générés plus que d'autres, compromettant potentiellement les conclusions de l'étude.
Une nouvelle méthode qui élimine les biais
Szabolcs Horvát et Carl Modes du Center for Systems Biology Dresden (CSBD) et du Max Planck Institute of Molecular Cell Biology and Genetics (MPI-CBG) ont développé un tel modèle qui permet d'éliminer les biais, et parvenir à des conclusions solides. Szabolcs Horvát déclare, « Nous avons développé un modèle nul pour les réseaux connectés où le biais est sous contrôle et peut être pris en compte. Plus précisément, nous avons créé un algorithme qui peut générer des réseaux connectés aléatoirement avec un nombre prescrit de connexions pour chaque nœud. Avec notre méthode, nous avons démontré que des approches plus naïves mais couramment utilisées peuvent conduire à des conclusions invalides. » L'auteur coordinateur de l'étude, Carl Modes conclut :« Cette découverte illustre le besoin de méthodes mathématiquement bien fondées. Nous espérons que notre travail sera utile à la communauté scientifique des réseaux au sens large. Afin de faciliter au maximum son utilisation pour les autres chercheurs, nous avons également développé un logiciel et l'avons rendu public."