Crédit :CC0 Domaine Public
Un réseau de neurones artificiels peut révéler des modèles dans d'énormes quantités de données d'expression génique et découvrir des groupes de gènes liés à la maladie. C'est ce qu'a montré une nouvelle étude menée par des chercheurs de l'Université de Linköping, Publié dans Communication Nature . Les scientifiques espèrent que la méthode pourra éventuellement être appliquée dans le cadre d'une médecine de précision et d'un traitement individualisé.
Il est courant, lors de l'utilisation des médias sociaux, que la plate-forme suggère des personnes que vous souhaitez peut-être ajouter en tant qu'amis. La suggestion est basée sur le fait que vous et l'autre personne avez des contacts communs, ce qui indique que vous vous connaissez peut-être. D'une manière similaire, les scientifiques créent des cartes de réseaux biologiques basées sur la façon dont différentes protéines ou gènes interagissent les uns avec les autres. Les chercheurs à l'origine d'une nouvelle étude ont utilisé l'intelligence artificielle, IA, étudier s'il est possible de découvrir des réseaux biologiques en utilisant le deep learning, dans lesquelles des entités connues sous le nom de "réseaux de neurones artificiels" sont entraînées par des données expérimentales. Étant donné que les réseaux de neurones artificiels sont excellents pour apprendre à trouver des modèles dans d'énormes quantités de données complexes, ils sont utilisés dans des applications telles que la reconnaissance d'images. Cependant, cette méthode d'apprentissage automatique a jusqu'à présent été peu utilisée en recherche biologique.
"Nous avons pour la première fois utilisé l'apprentissage en profondeur pour trouver des gènes liés à la maladie. C'est une méthode très puissante dans l'analyse d'énormes quantités d'informations biologiques, ou Big Data, " dit Sanjiv Dwivedi, post-doctorant au département de physique, Chimie et Biologie (IFM) à l'Université de Linköping.
Les scientifiques ont utilisé une grande base de données contenant des informations sur les modèles d'expression de 20, 000 gènes chez un grand nombre de personnes. L'information était "non triée, " dans le sens où les chercheurs n'ont pas donné au réseau de neurones artificiels des informations sur les modèles d'expression génique provenant de personnes atteintes de maladies, et qui provenaient de personnes en bonne santé. Le modèle d'IA a ensuite été entraîné pour trouver des modèles d'expression génique.
L'un des défis de l'apprentissage automatique est qu'il n'est pas possible de voir exactement comment un réseau de neurones artificiels résout une tâche. L'IA est parfois décrite comme une « boîte noire » :nous ne voyons que les informations que nous mettons dans la boîte et le résultat qu'elle produit. Nous ne pouvons pas voir les étapes entre les deux. Les réseaux de neurones artificiels sont constitués de plusieurs couches dans lesquelles les informations sont traitées mathématiquement. Le réseau comprend une couche d'entrée et une couche de sortie qui délivre le résultat du traitement de l'information effectué par le système. Entre ces deux couches se trouvent plusieurs couches cachées dans lesquelles les calculs sont effectués. Lorsque les scientifiques ont entraîné le réseau de neurones artificiels, ils se demandaient s'il était possible de soulever le couvercle de la boîte noire, en quelque sorte, et comprendre comment cela fonctionne. Les conceptions du réseau neuronal et des réseaux biologiques familiers sont-elles similaires ?
« Quand nous avons analysé notre réseau de neurones, il s'est avéré que la première couche cachée représentait dans une large mesure des interactions entre différentes protéines. Plus profondément dans le modèle, en revanche, au troisième niveau, nous avons trouvé des groupes de différents types de cellules. Il est extrêmement intéressant que ce type de groupement biologiquement pertinent soit produit automatiquement, étant donné que notre réseau est parti de données d'expression génique non classifiées, " dit Mika Gustafsson, maître de conférences à l'IFM et responsable de l'étude.
Les scientifiques ont ensuite cherché à savoir si leur modèle d'expression génique pouvait être utilisé pour déterminer quels modèles d'expression génique sont associés à la maladie et lesquels sont normaux. Ils ont confirmé que le modèle trouve des modèles pertinents qui s'accordent bien avec les mécanismes biologiques dans le corps. Étant donné que le modèle a été formé à l'aide de données non classifiées, il est possible que le réseau de neurones artificiels ait trouvé des modèles totalement nouveaux. Les chercheurs prévoient maintenant d'étudier si de tels, modèles auparavant inconnus, sont pertinents d'un point de vue biologique.
"Nous pensons que la clé pour progresser dans le domaine est de comprendre le réseau de neurones. Cela peut nous apprendre de nouvelles choses sur les contextes biologiques, comme les maladies dans lesquelles de nombreux facteurs interagissent. Et nous pensons que notre méthode donne des modèles plus faciles à généraliser et qui peuvent être utilisés pour de nombreux types d'informations biologiques, " dit Mika Gustafsson.
Mika Gustafsson espère qu'une collaboration étroite avec des chercheurs en médecine lui permettra d'appliquer la méthode développée dans l'étude en médecine de précision. C'est peut-être possible, par exemple, pour déterminer quels groupes de patients devraient recevoir un certain type de médicament, ou identifier les patients les plus touchés.