Une application d'intelligence artificielle est utilisée par un chercheur de KAUST pour trouver des gènes qui causent des maladies. Crédit :Kiyoshi Takahase Segundo / Alamy Banque D'Images
L'intelligence artificielle (IA) est exploitée par les chercheurs pour traquer les gènes qui causent la maladie. Une équipe KAUST prend un créatif, approche combinée d'apprentissage en profondeur qui utilise des données provenant de plusieurs sources pour enseigner aux algorithmes comment trouver des modèles entre les gènes et les maladies.
L'apprentissage automatique utilise des algorithmes et des modèles statistiques pour identifier des modèles et des associations parmi les données afin de résoudre des problèmes spécifiques. En saisissant suffisamment de données connues, comme les images taguées de "Jack, " le système peut éventuellement apprendre à suggérer d'autres images non taguées qui incluent Jack.
Les chercheurs utilisent cette application de l'IA pour trouver des gènes qui causent des maladies. Cependant, seul un nombre limité de gènes ont été confirmés expérimentalement comme étant en cause. Cela signifie que les scientifiques n'ont pas beaucoup de données à saisir dans leurs programmes pour les aider à apprendre les modèles décrivant les associations gène-maladie. Ainsi, ils doivent faire preuve de créativité pour trouver des moyens d'apprendre aux algorithmes d'apprentissage automatique, puis rechercher ces modèles.
Spécialiste des bases de données et de la gestion de l'information Panagiotis Kalnis, le bioscientifique informatique Xin Gao et ses collègues ont développé un modèle d'apprentissage en profondeur qui, selon eux, surpasse les méthodes de pointe actuelles.
D'abord, ils ont eu recours à des bases de données connues pour extraire des informations sur les emplacements et les fonctions des gènes et sur comment et quand ils s'allument et s'éteignent. Ces données ont été utilisées pour enseigner des algorithmes afin de trouver des gènes qui fonctionnent ensemble. Puis, ils ont obtenu des données sur les caractéristiques des maladies génétiques à partir d'autres bases de données. Cela a enseigné aux algorithmes comment identifier les maladies avec des manifestations similaires. Ils ont combiné ces ensembles de données avec des données sur les associations connues entre 12, 231 gènes et 3, 209 maladies.
Le modèle KAUST extrait les modèles tirés de la mise en réseau des gènes et des similitudes entre les maladies génétiques et les transfère vers un modèle d'apprentissage en profondeur appelé réseau convolutif de graphe. Cela fournit un autre ensemble de données qui est placé dans des matrices, tels que ceux utilisés dans les systèmes de recommandation, pour prédire l'association gène-maladie.
Le modèle a pu identifier des complexes, associations non linéaires entre gènes et maladies, lui permettant de prédire de nouvelles associations. "En utilisant plus d'informations, nous avons obtenu une meilleure précision que les méthodes de pointe actuellement utilisées, " dit Peng Han, le premier auteur de l'étude. "Mais, même si nous avons surpassé les autres méthodes dans nos expériences, il n'est pas encore assez précis pour être appliqué à l'industrie, " il ajoute.
L'équipe prévoit ensuite d'améliorer la précision de son modèle en incorporant plus de types de données. Ils appliqueront également la méthode pour résoudre d'autres types de problèmes où seules des données limitées sont disponibles, comme recommander de nouveaux endroits à visiter en fonction des préférences passées d'un utilisateur.