• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Chimie
    Le temps nécessaire pour séquencer les molécules clés pourrait être réduit de plusieurs années à quelques minutes

    Un logiciel de reconnaissance de nanopores et d'images permet de séquencer un glycosaminoglycane sulfaté en temps réel. Crédit :Institut polytechnique Rensselaer

    A l'aide d'un nanopore, les chercheurs ont démontré le potentiel de réduire le temps nécessaire au séquençage d'un glycosaminoglycane, une classe de molécules de sucre à longue chaîne aussi importante pour notre biologie que l'ADN, de plusieurs années à quelques minutes.

    Tel que publié cette semaine dans le Actes des Académies nationales des sciences , une équipe du Rensselaer Polytechnic Institute a montré qu'un logiciel d'apprentissage automatique et de reconnaissance d'images pouvait être utilisé pour identifier rapidement et avec précision les chaînes de sucre, en particulier, quatre héparanes sulfates synthétiques, basés sur les signaux électriques générés lorsqu'ils traversaient un petit trou dans une plaquette de cristal.

    « Les glycosaminoglycanes sont un répertoire complexe de séquences, comme l'œuvre de Shakespeare ou un poème de Yates est une collection complexe de lettres. Il faut un expert pour les rédiger et un expert pour les lire, " dit Robert Linhardt, chercheur principal et professeur de chimie et de biologie chimique au Rensselaer Polytechnic Institute. "Nous avons entraîné une machine à lire rapidement l'équivalent de mots avec quatre lettres comme 'ababab' ou 'bcbcbc.' Ce sont des séquences simples qui n'ont aucun sens, mais ils nous montrent qu'on peut apprendre à lire à la machine. Si nous étendons et développons cette technologie, il a le potentiel de séquencer les glycanes voire les protéines en temps réel, éliminant des années d'efforts."

    Des dispositifs commerciaux de séquençage à nanopores sont utilisés pour séquencer l'ADN, qui est composé de quatre unités d'acide nucléique, connu par les lettres A, C, G, et T, enchaînés dans une variété infinie de configurations. Le dispositif repose sur un courant ionique traversant un trou de seulement quelques milliardièmes de mètre de large dans une membrane. Des brins d'ADN sont placés d'un côté du trou, et entraîné par le courant. Chaque acide nucléique bloque quelque peu le trou lors de son passage, perturbant le courant et produisant un signal particulier associé à cet acide nucléique. Les appareils, actuellement utilisé pour le travail sur le terrain, ne sont qu'une des nombreuses techniques relativement rapides et automatisées pour le séquençage de l'ADN.

    Glycosaminoglycanes, ou GAG, sont une classe structurellement complexe de glycanes - les sucres essentiels présents dans les organismes vivants - trouvés sur les surfaces cellulaires et la matrice extracellulaire de tous les animaux et remplissent de nombreuses fonctions dans la croissance cellulaire et la signalisation, anticoagulation et cicatrisation des plaies, et le maintien de l'adhésion cellulaire. GAG, actuellement extrait d'animaux abattus, sont utilisés comme médicaments et nutraceutiques.

    Comme l'ADN, Les GAG peuvent être subdivisés en leurs unités de sucre disaccharide constitutives. Mais alors que l'ADN est composé de seulement quatre lettres dans une chaîne linéaire, ces glycanes ont des dizaines d'unités de base, certains avec des groupes sulfate attachés, groupes acides, et des groupes amides. Par exemple, même une molécule d'héparane sulfate naturelle relativement petite de six unités de sucre pourrait en avoir 32, 768 séquences possibles. En raison du défi, le séquençage des glycanes reste onéreux, s'appuyant sur un travail de laboratoire minutieux et des analyses sophistiquées, impliquant des techniques avec des noms comme la chromatographie liquide-spectrométrie de masse en tandem et la spectroscopie de résonance magnétique nucléaire.

    Dans le cadre de son travail, Linhardt, un expert en glycanes qui a développé une variante synthétique de l'héparine anticoagulante commune, séquence les GAG pour comprendre les formes naturelles et développer des variantes synthétiques.

    "En utilisant des méthodes analytiques standard, il nous a fallu deux ans pour séquencer le premier GAG simple, " dit Linhardt, membre du Centre Rensselaer pour la biotechnologie et les études interdisciplinaires. "Nous en avons un autre sur lequel nous avons travaillé la majeure partie de la séquence, et cela nous a pris plus de cinq ans - et il nous faudra probablement encore cinq ans pour le terminer, "

    Raisonnant que le séquençage des nanopores pourrait être utilisé pour identifier les unités disaccharidiques dans un GAG, l'équipe de recherche a construit son propre dispositif à nanopores et synthétisé quatre chaînes GAG de sulfate d'héparane à l'aide du processus chimioenzymatique développé par le laboratoire Linhardt. Surtout, ces quatre héparanes sulfates étaient très simples - fabriqués avec des combinaisons de seulement quatre types différents d'unités de sucre, assemblés en une chaîne d'environ 40 unités de long, et avec une composition et une séquence soigneusement contrôlées.

    L'équipe a passé chaque sulfate d'héparane à travers le nanopore et produit un graphique représentant la tension au fil du temps en sortie de l'appareil. Chacune des quatre variantes a été exécutée à travers l'appareil plus de 2, 000 fois, augmentant la probabilité statistique d'une lecture précise compte tenu de la conception rudimentaire du nanopore expérimental.

    "L'appareil a séquencé le sulfate d'héparane le plus simple en temps réel et a produit un motif que nos yeux pouvaient facilement reconnaître tout de suite pour chacun des quatre échantillons, " Linhardt a déclaré. "Vous pouvez immédiatement dire qu'ils sont différents."

    Pour garantir une analyse impartiale, l'équipe a introduit les résultats dans un logiciel gratuit d'apprentissage automatique et de reconnaissance d'images à l'aide du réseau de neurones profonds de Google, entraîner le logiciel à faire la distinction entre les quatre modèles différents et à identifier chaque variante de sulfate d'héparane. Le modèle d'apprentissage automatique le plus réussi a produit une analyse précise à près de 97 %.

    "Le contenu en information d'une séquence GAG ​​peut largement dépasser celui d'une quantité similaire d'ADN ou d'ARN, ce qui signifie que la capacité de lire rapidement les séquences GAG ouvre une nouvelle fenêtre de compréhension de la biochimie complexe de la vie ", a déclaré Curt Breneman, doyen de la Rensselaer School of Science. "Cette étude de preuve de concept associe des méthodes de nano-détection innovantes à des outils d'apprentissage automatique de pointe, et montre le pouvoir de la pensée interdisciplinaire pour repousser les frontières de la connaissance."

    Réduire la vitesse à laquelle les GAG traversent le nanopore pourrait augmenter la précision, et l'appareil peut être entraîné sur des unités sucre supplémentaires, et des séquences plus complexes, qui sont tous des objectifs de recherche futurs. Linhardt a déclaré que la machine devrait apprendre quelque part entre 10 et 20 unités de sucre pour séquencer complètement un GAG.

    « C'est une preuve de concept ; nous l'avons fait lire des mots de deux lettres, " a déclaré Linhardt. " Une fois que nous lui avons appris l'alphabet complet, il sera capable de lire toutes les séquences différentes. Il sera capable de lire tous les mots."


    © Science https://fr.scienceaq.com