Il s'agit d'une infographie d'une molécule d'ARN. Crédit :Richard Feldmann/Wikipédia
Des chercheurs de l'Oregon State University ont développé un programme informatique qui représente une étape clé vers une meilleure compréhension des liens entre le matériel génétique mutant et la maladie.
Connu sous le nom de bpRNA, le logiciel est un outil d'annotation de données volumineuses pour les structures secondaires dans les acides ribonucléiques.
"Il est capable d'analyser les structures d'ARN, y compris les ARN complexes contenant des pseudonœuds, donc vous vous retrouvez avec un objectif, précis, description facilement interprétable de toutes les boucles, tiges et pseudo-nœuds, " a déclaré l'auteur correspondant David Hendrix. " Vous obtenez également les positions, séquence et paires de bases flanquantes de chaque élément structurel, ce qui nous permet d'étudier la structure de l'ARN en masse à grande échelle."
L'ARN fonctionne avec l'ADN, l'autre acide nucléique - ainsi nommé parce qu'il a été découvert pour la première fois dans les noyaux cellulaires des êtres vivants - pour produire les protéines nécessaires dans tout le corps. L'ADN contient les informations héréditaires d'une personne, et l'ARN fournit les instructions codées de l'information aux sites de fabrication de protéines dans les cellules. De nombreuses molécules d'ARN ne codent pas pour une protéine, et ceux-ci sont connus comme des ARN non codants.
"Il existe de nombreux exemples de mutations associées à la maladie dans les ARN non codants qui affectent probablement leur structure, et afin d'analyser statistiquement pourquoi ces mutations sont liées à la maladie, nous devons automatiser l'analyse de la structure de l'ARN, " dit Hendrix, professeur adjoint de biochimie et de biophysique au Collège des sciences. "L'ARN est l'un des éléments fondamentaux, molécules essentielles à la vie, et nous devons comprendre la structure des ARN pour comprendre comment ils fonctionnent."
Les structures secondaires sont les interactions d'appariement de bases au sein d'un seul polymère d'acide nucléique ou entre deux polymères. L'ADN a principalement des doubles hélices entièrement appariées, mais l'ARN est simple brin et peut former des interactions compliquées.
Hendrix dit bpRNA, présenté ce mois-ci dans un article en Recherche sur les acides nucléiques , présente la base de données la plus grande et la plus détaillée à ce jour sur les structures d'ARN secondaires.
"Pour être honnête, c'est une méta-base de données, mais notre sauce spéciale est l'outil pour tout annoter, " dit Hendrix, qui est également professeur adjoint à l'OSU College of Engineering. "Avant, il n'y avait aucun moyen de dire où toutes les caractéristiques structurelles étaient de manière automatisée. Nous fournissons une carte à code couleur de l'endroit où tout se trouve. Ces annotations nous permettront d'identifier les tendances statistiques qui peuvent faire la lumière sur la formation de la structure de l'ARN et peuvent ouvrir la porte aux algorithmes d'apprentissage automatique pour prédire la structure de l'ARN secondaire d'une manière qui n'a pas été possible."
Les chercheurs ont testé avec succès l'outil sur plus de 100, 000 structures, "dont beaucoup sont très complexes, avec beaucoup de pseudo-nœuds complexes."
"Chaque jour, de nouveaux ARN sont découverts et les chercheurs font d'énormes progrès dans la compréhension de leur fonction, " a déclaré Hendrix. " Nous commençons à comprendre que le génome est plein d'ARN non codants en plus des ARN messagers, et ce sont des molécules biologiques importantes avec de grands effets sur la santé humaine et les maladies. »