Brian Cafferty, un chercheur postdoctoral dans le laboratoire de George Whitesides, co-auteur d'un article sur les nouvelles avancées en matière de stockage moléculaire. Crédit :Kris Snibbe/photographe du personnel de Harvard
Des livres aux disquettes en passant par la mémoire magnétique, les technologies de stockage des informations continuent de s'améliorer. Pourtant, des menaces aussi simples que l'eau et aussi complexes que les cyberattaques peuvent toujours corrompre nos dossiers.
Alors que le boom des données se poursuit, de plus en plus d'informations sont stockées dans de moins en moins d'espace. Même le nuage, dont le nom promet d'être opaque, espace infini - finira par atteindre sa limite de stockage, ne peut pas déjouer tous les pirates, et engloutit l'énergie. Maintenant, une nouvelle façon de stocker des informations en dehors de l'Internet piratable, n'utilise pas d'énergie une fois écrit, et, selon l'un des chercheurs qui l'ont développé, "pourrait permettre à l'information d'être préservée pendant des millions d'années."
"Pensez à stocker le contenu de la bibliothèque publique de New York avec une cuillère à café de protéines, " a déclaré Brian Cafferty, chercheur postdoctoral dans le laboratoire de George Whitesides et auteur d'un article décrivant la nouvelle technique. Le travail a été réalisé en collaboration avec Milan Mrksich et son groupe à la Northwestern University.
"Au moins à ce stade, nous ne voyons pas cette méthode concurrencer les méthodes existantes de stockage de données, " a déclaré Cafferty. " Nous le considérons plutôt comme complémentaire à ces technologies et, comme objectif initial, bien adapté pour le stockage de données d'archivage à long terme."
L'outil chimique de Cafferty pourrait ne pas remplacer le nuage. Mais le système de classement offre une alternative séduisante aux outils de stockage biologique tels que l'ADN synthétique, que les scientifiques ont récemment appris à manipuler pour enregistrer toute information, y compris les GIF, tutoriels de cuisine, texte, et musique.
Mais alors que l'ADN est petit comparé aux puces informatiques, il est grand dans le monde moléculaire. Et la synthèse de l'ADN nécessite un travail qualifié et souvent répétitif. Si chaque message doit être conçu à partir de zéro, le stockage de macromolécules pourrait être un travail long et coûteux.
« Nous avons entrepris d'explorer une stratégie qui n'emprunte pas directement à la biologie, " a déclaré Cafferty. " Nous nous sommes plutôt appuyés sur des techniques courantes en chimie organique et analytique, et développé une approche qui utilise de petits, molécules de faible poids moléculaire pour coder l'information."
Avec une seule synthèse, l'équipe a produit suffisamment de petites molécules pour encoder plusieurs vidéos à la fois, rendant l'approche moins laborieuse et moins chère qu'une approche basée sur l'ADN. Pour leurs molécules de faible poids, l'équipe a sélectionné des oligopeptides (deux ou plusieurs peptides liés ensemble), qui sont communs, stable, et plus petit que l'ADN, ARN, ou des protéines.
Les oligopeptides varient en masse, selon leur nombre et leur type d'acides aminés. Mélangés ensemble, ils se distinguent les uns des autres, comme des lettres dans la soupe à l'alphabet.
Faire des mots à partir des lettres est un peu plus compliqué :dans un micropuits, comme une version miniature d'un Whack-a-mole, mais avec 384 trous, chaque puits contient des oligopeptides. Lorsque l'encre est absorbée sur une page, les mélanges d'oligopeptides sont assemblés sur une surface métallique où ils sont stockés. Si l'équipe veut relire ce qu'elle a "écrit, " ils regardent l'un des puits à travers un spectromètre de masse, qui trie les molécules par masse. Cela leur indique quels oligopeptides étaient présents ou absents :leur masse les trahit.
Traduire le fouillis de molécules en lettres et en mots, les chercheurs ont emprunté le code binaire. Un M, par exemple, utilise quatre des huit oligopeptides possibles, chacun avec une masse différente. Les quatre flottant dans le puits reçoivent un 1, tandis que les quatre manquants reçoivent un zéro. Le code moléculaire-binaire pointe vers une lettre correspondante ou, si l'information est une image, un pixel correspondant.
Avec cette méthode, un mélange de huit oligopeptides pourrait stocker un octet d'information; 32 peut stocker quatre octets; etc.
Jusque là, Cafferty et son équipe ont « écrit, " stocké, et « lisez » la célèbre conférence du physicien Richard Feynman « Il y a beaucoup de place au fond, " une photo de Claude Shannon (connu comme le père de la théorie de l'information), et la gravure sur bois de Hokusai "La grande vague au large de Kanagawa". Comme on estime que les archives numériques mondiales atteindront 44 000 milliards de gigaoctets d'ici 2020 (10 fois sa taille en 2013), l'image d'un tsunami semblait appropriée.
L'équipe peut récupérer ses chefs-d'œuvre stockés avec une précision de 99,9 %. Leur écriture est en moyenne de huit bits par seconde et leur lecture, 20. Parce que leur vitesse d'écriture dépasse de loin l'écriture avec de l'ADN synthétique, à ce stade, la lecture pourrait être à la fois plus rapide et moins chère avec la macromolécule. Mais avec une technologie plus rapide, les vitesses de l'équipe augmenteront probablement. Une imprimante à jet d'encre, par exemple, pourrait générer des baisses à des taux de 1, 000 par seconde et entasser plus d'informations dans des zones plus petites. Et les spectromètres de masse améliorés pourraient absorber encore plus d'informations à la fois.
L'équipe pourrait également améliorer la stabilité, Coût, et la capacité de leur stockage moléculaire avec différentes classes de molécules. Leurs oligopeptides sont fabriqués sur mesure et, donc, plus cher. Mais les futurs constructeurs de bibliothèques pourraient acheter des molécules bon marché comme les alcanethiols, qui pourrait enregistrer 100, 000, 000 bits d'information pour un centime seulement. Contrairement à d'autres systèmes de stockage d'informations moléculaires, qui reposent sur une molécule spécifique, cette approche peut utiliser n'importe quelle molécule malléable tant qu'elle peut être manipulée en morceaux distincts.
Les oligopeptides et autres choix similaires sont déjà résilients. "Les oligopeptides ont des stabilités de centaines ou de milliers d'années dans des conditions adaptées, " selon le papier. Les molécules résistantes peuvent durer sans lumière ni oxygène, en cas de forte chaleur et de sécheresse. Et, contrairement au nuage, auquel les pirates peuvent accéder depuis leur fauteuil préféré, le stockage moléculaire n'est accessible qu'en personne. Même si un voleur trouve la cache de données, la chimie est nécessaire pour récupérer le code.
Cette histoire est publiée avec l'aimable autorisation de la Harvard Gazette, Journal officiel de l'université Harvard. Pour des nouvelles universitaires supplémentaires, visitez Harvard.edu.