Un fragment d'ADN double brin. Crédit :Vcpmartin/Wikimedia/ CC BY-SA 4.0
Imaginez la "Suite pour violoncelle n° 1" de Bach jouée sur un brin d'ADN.
Ce scénario n'est pas aussi impossible qu'il y paraît. Trop petit pour résister à un grattage rythmique ou à une corde d'arc coulissante, l'ADN est une centrale électrique pour stocker des fichiers audio et toutes sortes d'autres médias.
"L'ADN est le système de stockage de données original de la nature. Nous pouvons l'utiliser pour stocker n'importe quel type de données :images, vidéo, musique, n'importe quoi", a déclaré Kasra Tabatabaei, chercheuse à l'Institut Beckman pour les sciences et technologies avancées et co-auteur de cette étude.
L'expansion de la composition moléculaire de l'ADN et le développement d'une nouvelle méthode de séquençage précise ont permis à une équipe multi-institutionnelle de transformer la double hélice en une plate-forme de stockage de données robuste et durable.
L'article de l'équipe est paru dans Nano Letters en février 2022.
À l'ère de l'information numérique, quiconque est assez courageux pour naviguer dans les actualités quotidiennes a l'impression que les archives mondiales s'alourdissent de jour en jour. De plus en plus, les dossiers papier sont numérisés pour économiser de l'espace et protéger les informations contre les catastrophes naturelles.
Des scientifiques aux influenceurs des médias sociaux, toute personne ayant des informations à stocker peut bénéficier d'une boîte de verrouillage de données sécurisée et durable, et la double hélice fait l'affaire.
"L'ADN est l'une des meilleures options, sinon la meilleure option, pour stocker des données d'archives en particulier", a déclaré Chao Pan, étudiant diplômé à l'Université de l'Illinois à Urbana-Champaign et co-auteur de cette étude.
Sa longévité n'ayant d'égal que sa durabilité, l'ADN est conçu pour résister aux conditions les plus difficiles de la Terre, parfois pendant des dizaines de milliers d'années, et reste une source de données viable. Les scientifiques peuvent séquencer des brins fossilisés pour découvrir des histoires génétiques et donner vie à des paysages perdus depuis longtemps.
Malgré sa petite taille, l'ADN ressemble un peu à la tristement célèbre boîte de police de Dr. Who :plus gros à l'intérieur qu'il n'y paraît.
"Chaque jour, plusieurs pétaoctets de données sont générés sur Internet. Un seul gramme d'ADN suffirait pour stocker ces données. C'est à quel point l'ADN est dense en tant que support de stockage", a déclaré Tabatabaei, qui est également en cinquième année de doctorat. RÉ. étudiant.
Un autre aspect important de l'ADN est son abondance naturelle et son renouvellement quasi infini, un trait que ne partage pas le système de stockage de données le plus avancé sur le marché aujourd'hui :les micropuces de silicium, qui circulent souvent pendant quelques décennies avant un enterrement sans cérémonie dans un tas d'e décharges. -déchets.
« À une époque où nous sommes confrontés à des défis climatiques sans précédent, l'importance des technologies de stockage durable ne peut être surestimée. De nouvelles technologies vertes pour l'enregistrement de l'ADN font leur apparition et rendront le stockage moléculaire encore plus important à l'avenir », a déclaré Olgica Milenkovic, du Franklin W. Woeltge Professeur de génie électrique et informatique et co-PI sur l'étude.
Envisageant l'avenir du stockage de données, l'équipe interdisciplinaire a examiné le MO millénaire de l'ADN. Ensuite, les chercheurs ont ajouté leur propre touche du XXIe siècle.
Dans la nature, chaque brin d'ADN contient quatre produits chimiques - l'adénine, la guanine, la cytosine et la thymine - souvent désignés par les initiales A, G, C et T. Ils s'arrangent et se réarrangent le long de la double hélice en combinaisons que les scientifiques peuvent décoder. , ou séquence, pour donner du sens.
The researchers expanded DNA's already broad capacity for information storage by adding seven synthetic nucleobases to the existing four-letter lineup.
"Imagine the English alphabet. If you only had four letters to use, you could only create so many words. If you had the full alphabet, you could produce limitless word combinations. That's the same with DNA. Instead of converting zeroes and ones to A, G, C, and T, we can convert zeroes and ones to A, G, C, T, and the seven new letters in the storage alphabet," Tabatabaei said.
Because this team is the first to use chemically modified nucleotides for information storage in DNA, members innovated around a unique challenge:Not all current technology is capable of interpreting chemically modified DNA strands. To solve this problem, they combined machine learning and artificial intelligence to develop a first-of-its-kind DNA sequence readout processing method.
Their solution can discern modified chemicals from natural ones, and differentiate each of the seven new molecules from one another.
"We tried 77 different combinations of the 11 nucleotides, and our method was able to differentiate each of them perfectly," Pan said. "The deep learning framework as part of our method to identify different nucleotides is universal, which enables the generalizability of our approach to many other applications."
This letter-perfect translation comes courtesy of nanopores:proteins with an opening in the middle through which a DNA strand can easily pass. Remarkably, the team found that nanopores can detect and distinguish each individual monomer unit along the DNA strand—whether the units have natural or chemical origins.
"This work provides an exciting proof-of-principle demonstration of extending macromolecular data storage to non-natural chemistries, which hold the potential to drastically increase storage density in non-traditional storage media," said Charles Schroeder, the James Economy Professor of Materials Science and Engineering and a co-PI on this study.
DNA literally made history by storing genetic information. By the looks of this study, the future of data storage is just as double-helical. Using DNA-like punch cards to store data