Prédiction du comportement cellulaire in silico :formé sur des données qui capturent les effets de stimulation pour un ensemble de types cellulaires, scGen peut être utilisé pour modéliser les réponses cellulaires dans un nouveau type de cellule. Crédit :Helmholtz Zentrum München
Des atlas à grande échelle d'organes sains seront bientôt disponibles, en particulier, l'Atlas des cellules humaines. Il s'agit d'une étape importante dans une meilleure compréhension des cellules, tissus et organes en bon état et fournit une référence lors du diagnostic, surveiller et traiter la maladie. Cependant, en raison du grand nombre de combinaisons possibles de traitements et d'états pathologiques, l'élargissement de ces données pour caractériser les maladies et le traitement des maladies dans les laboratoires traditionnels des sciences de la vie demande beaucoup de travail et coûte cher, et donc non évolutif.
Modéliser avec précision la réponse cellulaire aux perturbations (par exemple, maladie, composés, interventions génétiques) est un objectif central de la biologie computationnelle. Bien qu'il existe des modèles basés sur des approches statistiques et mécanistes, aucune solution basée sur l'apprentissage automatique viable pour les phénomènes de grande dimension non observés n'a encore été disponible. En outre, scGen est le premier outil qui prédit la réponse cellulaire hors échantillon. Cela signifie que scGen, s'il est formé sur des données qui capturent l'effet des perturbations pour un système donné, est capable de faire des prédictions fiables pour un système différent. "Pour la première fois, nous avons la possibilité d'utiliser les données générées dans un système modèle tel que la souris et d'utiliser les données pour prédire la réponse à la maladie ou au traitement chez les patients humains, " dit Mohammed Lotfollahi, doctorat étudiant (Helmholtz Zentrum München et Technische Universität München).
scGen est un modèle d'apprentissage profond génératif qui exploite les idées de l'image, traitement des séquences et du langage, et, pour la première fois, applique ces idées pour modéliser le comportement d'une cellule in silico. La prochaine étape pour l'équipe concerne l'amélioration de scGen vers une formulation entièrement basée sur les données, augmenter son pouvoir prédictif pour permettre l'étude de combinaisons de perturbations. « Nous pouvons maintenant commencer à optimiser scGen pour répondre à des questions de plus en plus complexes sur les maladies, " dit Alex Loup, Chef d'équipe, et Fabien Théis, Directeur de l'Institut de biologie computationnelle et chaire de modélisation mathématique des systèmes biologiques à la Technische Universität München.