• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Chimie
    L'apprentissage automatique découvre de nouvelles séquences pour stimuler l'administration de médicaments

    Les chercheurs du MIT ont combiné la chimie expérimentale avec l'intelligence artificielle pour découvrir des peptides hautement actifs qui peuvent être attachés à des oligomères phosphorodiamidate morpholino (PMO) pour faciliter l'administration de médicaments. En développant ces nouvelles séquences, les chercheurs espèrent accélérer rapidement le développement de thérapies géniques pour la dystrophie musculaire de Duchenne et d'autres maladies. Crédit :Massachusetts Institute of Technology

    Dystrophie musculaire de Duchenne (DMD), une maladie génétique rare généralement diagnostiquée chez les jeunes garçons, affaiblit progressivement les muscles de tout le corps jusqu'à ce que le cœur ou les poumons échouent. Les symptômes apparaissent souvent à l'âge de 5 ans; à mesure que la maladie progresse, les patients perdent la capacité de marcher vers l'âge de 12 ans. Aujourd'hui, l'espérance de vie moyenne des patients atteints de DMD oscille autour de 26 ans.

    C'était une grande nouvelle, alors, quand Cambridge, Sarepta Therapeutics, basée au Massachusetts, a annoncé en 2019 un médicament révolutionnaire qui cible directement le gène muté responsable de la DMD. La thérapie utilise des oligomères morpholino phosphorodiamidate antisens (PMO), une grosse molécule synthétique qui imprègne le noyau cellulaire afin de modifier le gène de la dystrophine, permettant la production d'une protéine clé qui est normalement absente chez les patients DMD. "Mais il y a un problème avec le PMO en lui-même. Ce n'est pas très bon pour entrer dans les cellules, " dit Carly Schissel, un doctorat candidat au département de chimie du MIT.

    Pour augmenter la livraison au noyau, les chercheurs peuvent apposer des peptides pénétrant dans les cellules (CPP) au médicament, l'aidant ainsi à traverser les membranes cellulaires et nucléaires pour atteindre sa cible. Quelle séquence peptidique est la meilleure pour le travail, cependant, est restée une question en suspens.

    Les chercheurs du MIT ont maintenant développé une approche systématique pour résoudre ce problème en combinant la chimie expérimentale avec l'intelligence artificielle pour découvrir non toxique, peptides hautement actifs qui peuvent être attachés au PMO pour faciliter l'administration. En développant ces nouvelles séquences, ils espèrent accélérer rapidement le développement de thérapies géniques pour la DMD et d'autres maladies.

    Les résultats de leur étude ont été publiés dans la revue Chimie de la nature dans un article dirigé par Schissel et Somesh Mohapatra, un doctorat étudiant au Département de science et génie des matériaux du MIT, qui sont les auteurs principaux. Rafael Gomez-Bombarelli, professeur assistant en science et ingénierie des matériaux, et Bradley Pentelute, professeur de chimie, sont les auteurs principaux de l'article. D'autres auteurs incluent Justin Wolfe, Colin Fadzen, Kamela Bellovoda, Chia-Ling Wu, Jenna Bois, Annika Malmberg, et Andreï Loas.

    "Proposer de nouveaux peptides avec un ordinateur n'est pas très difficile. Juger s'ils sont bons ou pas, c'est ça qui est dur, " explique Gomez-Bombarelli. " L'innovation clé consiste à utiliser l'apprentissage automatique pour connecter la séquence d'un peptide, en particulier un peptide qui comprend des acides aminés non naturels, à une activité biologique mesurée expérimentalement.

    Données de rêve

    Les CPP sont des chaînes relativement courtes, composé de 5 à 20 acides aminés. Alors qu'un seul CPP peut avoir un impact positif sur l'administration de médicaments, plusieurs reliés entre eux ont un effet synergique dans le transport de la drogue jusqu'à la ligne d'arrivée. Ces chaînes plus longues, contenant 30 à 80 acides aminés, sont appelées miniprotéines.

    Avant qu'un modèle puisse faire des prédictions valables, les chercheurs du côté expérimental devaient créer un ensemble de données robuste. En mélangeant et en faisant correspondre 57 peptides différents, Schissel et ses collègues ont pu construire une bibliothèque de 600 miniprotéines, chacun attaché au PMO. Avec un dosage, l'équipe a pu quantifier dans quelle mesure chaque miniprotéine pouvait déplacer sa cargaison à travers la cellule.

    La décision de tester l'activité de chaque séquence, avec PMO déjà attaché, était important. Étant donné qu'un médicament donné modifiera probablement l'activité d'une séquence CPP, il est difficile de réutiliser les données existantes, et des données générées dans un seul laboratoire, sur les mêmes machines, par les mêmes personnes, répondre à une norme d'or en matière de cohérence dans les ensembles de données d'apprentissage automatique.

    L'un des objectifs du projet était de créer un modèle qui pourrait fonctionner avec n'importe quel acide aminé. Alors que seulement 20 acides aminés sont naturellement présents dans le corps humain, des centaines d'autres existent ailleurs, comme un pack d'extension d'acides aminés pour le développement de médicaments. Pour les représenter dans un modèle d'apprentissage automatique, les chercheurs utilisent généralement un codage à chaud, une méthode qui affecte chaque composant à une série de variables binaires. Trois acides aminés, par exemple, serait représenté par 100, 010, et 001. Pour ajouter de nouveaux acides aminés, le nombre de variables devrait augmenter, ce qui signifie que les chercheurs seraient obligés de reconstruire leur modèle à chaque ajout.

    Au lieu, l'équipe a choisi de représenter les acides aminés avec des empreintes topologiques, qui crée essentiellement un code-barres unique pour chaque séquence, chaque ligne du code à barres indiquant la présence ou l'absence d'une sous-structure moléculaire particulière. "Même si le modèle n'a jamais vu [une séquence] auparavant, on peut le représenter comme un code barre, ce qui est cohérent avec les règles que le modèle a vues, " dit Mohapatra, qui a dirigé les efforts de développement du projet. En utilisant ce système de représentation, les chercheurs ont pu élargir leur boîte à outils de séquences possibles.

    L'équipe a formé un réseau de neurones convolutifs sur la bibliothèque de miniprotéines, avec chacune des 600 miniprotéines étiquetées avec son activité, indiquant sa capacité à pénétrer la cellule. Tôt, le modèle proposait des miniprotéines chargées en arginine, un acide aminé qui déchire un trou dans la membrane cellulaire, ce qui n'est pas idéal pour maintenir les cellules en vie. Pour résoudre ce problème, les chercheurs ont utilisé un optimiseur pour décentrer l'arginine, empêcher le modèle de tricher.

    À la fin, la capacité d'interpréter les prédictions proposées par le modèle était la clé. "Il ne suffit généralement pas d'avoir une boîte noire, parce que les modèles pourraient se concentrer sur quelque chose qui n'est pas correct, ou parce qu'il pourrait exploiter un phénomène de manière imparfaite, ", dit Gomez-Bombarelli.

    Dans ce cas, les chercheurs pourraient superposer les prédictions générées par le modèle avec le code-barres représentant la structure de la séquence. « Cela met en évidence certaines régions qui, selon le modèle, jouent le plus grand rôle dans la haute activité, " Schissel dit. " Ce n'est pas parfait, mais cela vous donne des régions ciblées avec lesquelles jouer. Ces informations nous aideraient certainement à l'avenir à concevoir de nouvelles séquences de manière empirique. »

    Augmentation de la livraison

    Finalement, le modèle d'apprentissage automatique proposait des séquences plus efficaces que n'importe quelle variante connue auparavant. Un en particulier peut multiplier par 50 la livraison du PMO. By injecting mice with these computer-suggested sequences, the researchers validated their predictions and demonstrated that the miniproteins are nontoxic.

    It is too early to tell how this work will affect patients down the line, but better PMO delivery will be beneficial in several ways. If patients are exposed to lower levels of the drug, they may experience fewer side effects, par exemple, or require less-frequent doses (PMO is administered intravenously, often on a weekly basis). The treatment may also become less costly. As a testament to the concept, recent clinical trials demonstrated that a proprietary CPP from Sarepta Therapeutics could decrease exposure to PMO by 10-fold. Aussi, PMO is not the only drug that stands to be improved by miniproteins. In additional experiments, the model-generated miniproteins carried other functional proteins into the cell.

    Noticing a disconnect between the work of machine-learning researchers and experimental chemists, Mohapatra has posted the model on GitHub, along with a tutorial for experimentalists who have their own list of sequences and activities. He notes that over a dozen people from across the world have adopted the model so far, repurposing it to make their own powerful predictions for a wide range of drugs.

    Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.




    © Science https://fr.scienceaq.com