• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Physique
    Stocker des données dans l'ADN fait entrer la nature dans l'univers numérique

    La prochaine frontière du stockage de données :l'ADN. Crédit :ymgerman/Shutterstock.com

    L'humanité produit des données à un rythme inimaginable, au point que les technologies de stockage ne peuvent pas suivre. Tous les cinq ans, la quantité de données que nous produisons est multipliée par 10, y compris des photos et des vidéos. Tout n'a pas besoin d'être stocké, mais les fabricants de stockage de données ne fabriquent pas des disques durs et des puces flash assez rapides pour contenir ce que nous voulons conserver. Puisque nous n'allons pas arrêter de prendre des photos et d'enregistrer des films, nous devons développer de nouvelles façons de les sauver.

    Au fil des millénaires, la nature a développé un incroyable support de stockage d'informations - l'ADN. Il a évolué pour stocker des informations génétiques, des plans pour la construction de protéines, mais l'ADN peut être utilisé à bien d'autres fins que cela. L'ADN est également beaucoup plus dense que les supports de stockage modernes :les données de centaines de milliers de DVD pourraient tenir dans un paquet d'ADN de la taille d'une boîte d'allumettes. L'ADN est également beaucoup plus durable - des milliers d'années - que les disques durs d'aujourd'hui, qui peut durer des années ou des décennies. Et tandis que les formats de disque dur et les normes de connexion deviennent obsolètes, L'ADN ne le fera jamais, du moins tant qu'il y a de la vie.

    L'idée de stocker des données numériques dans l'ADN est vieille de plusieurs décennies, mais des travaux récents de Harvard et de l'Institut européen de bioinformatique ont montré que les progrès des méthodes modernes de manipulation de l'ADN pourraient le rendre à la fois possible et pratique aujourd'hui. De nombreux groupes de recherche, y compris à l'ETH Zurich, l'Université de l'Illinois à Urbana-Champaign et l'Université de Columbia travaillent sur ce problème. Notre propre groupe à l'Université de Washington et Microsoft détient le record mondial de la quantité de données stockées et récupérées avec succès à partir de l'ADN – 200 mégaoctets.

    Préparer les bits à devenir des atomes

    Les supports traditionnels comme les disques durs, les clés USB ou les DVD stockent des données numériques en changeant soit le magnétique, propriétés électriques ou optiques d'un matériau pour stocker des 0 et des 1.

    Pour stocker des données dans l'ADN, Le concept est le même, mais le processus est différent. Les molécules d'ADN sont de longues séquences de molécules plus petites, appelés nucléotides – adénine, cytosine, thymine et guanine, généralement désigné par A, C, T et G. Plutôt que de créer des séquences de 0 et de 1, comme dans les médias électroniques, Le stockage de l'ADN utilise des séquences de nucléotides.

    Il y a plusieurs moyens de le faire, mais l'idée générale est d'attribuer des modèles de données numériques aux nucléotides d'ADN. Par exemple, 00 pourrait être équivalent à A, 01 à C, 10 à T et 11 à G. Pour mémoriser une image, par exemple, on commence par son encodage sous forme de fichier numérique, comme un JPEG. Ce fichier est, en substance, une longue chaîne de 0 et de 1. Disons que les huit premiers bits du fichier sont 01111000; nous les décomposons par paires – 01 11 10 00 – qui correspondent à C-G-T-A. C'est l'ordre dans lequel nous joignons les nucléotides pour former un brin d'ADN.

    Les fichiers informatiques numériques peuvent être assez volumineux, voire des téraoctets pour les bases de données volumineuses. Mais les brins d'ADN individuels doivent être beaucoup plus courts, ne contenant qu'environ 20 octets chacun. C'est parce que plus un brin d'ADN est long, plus il est difficile de construire chimiquement.

    Nous devons donc diviser les données en plus petits morceaux, et ajoutez à chacun un indicateur de l'endroit où il se situe dans la séquence. Quand il est temps de lire les informations stockées dans l'ADN, cet indicateur garantira que tous les morceaux de données restent dans leur ordre approprié.

    Maintenant, nous avons un plan sur la façon de stocker les données. Ensuite, nous devons réellement le faire.

    Stockage des données

    Après avoir déterminé dans quel ordre les lettres doivent entrer, les séquences d'ADN sont fabriquées lettre par lettre avec des réactions chimiques. Ces réactions sont entraînées par un équipement qui prend des bouteilles de A, C's, G et T et les mélange dans une solution liquide avec d'autres produits chimiques pour contrôler les réactions qui spécifient l'ordre des brins d'ADN physiques.

    Ce processus nous apporte un autre avantage du stockage d'ADN :les copies de sauvegarde. Plutôt que de faire un brin à la fois, les réactions chimiques font plusieurs brins identiques à la fois, avant de faire de nombreuses copies du prochain volet de la série.

    Une fois les brins d'ADN créés, nous devons les protéger contre les dommages causés par l'humidité et la lumière. Nous les séchons donc et les mettons dans un récipient qui les garde au froid et bloque l'eau et la lumière.

    Mais les données stockées ne sont utiles que si nous pouvons les récupérer plus tard.

    Relecture des données

    Pour relire les données hors du stockage, nous utilisons une machine de séquençage exactement comme celles utilisées pour l'analyse de l'ADN génomique dans les cellules. Celui-ci identifie les molécules, générer une séquence de lettres par molécule, que nous décodons ensuite en une séquence binaire de 0 et de 1 dans l'ordre. Ce processus peut détruire l'ADN lors de sa lecture, mais c'est là que ces copies de sauvegarde entrent en jeu :il existe de nombreuses copies de chaque séquence.

    Et si les copies de sauvegarde sont épuisées, il est facile de faire des copies pour recharger le stockage, tout comme la nature copie l'ADN tout le temps.

    À l'heure actuelle, la plupart des systèmes de récupération d'ADN nécessitent la lecture de toutes les informations stockées dans un conteneur particulier, même si nous n'en voulons qu'une petite quantité. C'est comme lire la valeur d'un disque dur entier d'informations juste pour trouver un message électronique. Nous avons développé des techniques - basées sur des méthodes biochimiques bien étudiées - qui nous permettent d'identifier et de lire uniquement les informations spécifiques qu'un utilisateur a besoin de récupérer à partir du stockage d'ADN.

    Défis restants

    Maintenant, Le stockage de l'ADN est expérimental. Avant que cela ne devienne banal, il doit être complètement automatisé, et les processus de construction et de lecture de l'ADN doivent être améliorés. Ils sont à la fois sujets aux erreurs et relativement lents. Par exemple, la synthèse d'ADN d'aujourd'hui nous permet d'écrire quelques centaines d'octets par seconde; un disque dur moderne peut écrire des centaines de millions d'octets par seconde. Une photo iPhone moyenne prendrait plusieurs heures à stocker dans l'ADN, bien qu'il faille moins d'une seconde pour enregistrer sur le téléphone ou transférer sur un ordinateur.

    Ce sont des défis importants, mais nous sommes optimistes car toutes les technologies pertinentes s'améliorent rapidement. Plus loin, Le stockage des données ADN n'a pas besoin de la précision parfaite requise par la biologie, les chercheurs sont donc susceptibles de trouver des moyens encore moins chers et plus rapides de stocker des informations dans le plus ancien système de stockage de données de la nature.

    Cet article a été initialement publié sur The Conversation. Lire l'article original.

    © Science https://fr.scienceaq.com