Crédit :Unsplash/CC0 Domaine public
En 2020, chaque personne dans le monde produit environ 1,7 mégaoctet de données par seconde. En une seule année, cela représente 418 zettaoctets, soit 418 milliards de disques durs d'un téraoctet.
Nous stockons actuellement les données sous forme de uns et de zéros dans des systèmes magnétiques ou optiques à durée de vie limitée. Pendant ce temps, les centres de données consomment des quantités massives d'énergie et produisent d'énormes empreintes carbone. Tout simplement, la façon dont nous stockons notre volume toujours croissant de données est insoutenable.
L'ADN comme stockage de données
Mais il existe une alternative :stocker des données dans des molécules biologiques telles que l'ADN. Dans la nature, L'ADN encode, magasins, et rend lisible des quantités massives d'informations génétiques dans de minuscules espaces (cellules, bactéries, virus) et le fait avec un degré élevé de sécurité et de reproductibilité.
Par rapport aux dispositifs de stockage de données conventionnels, L'ADN est plus endurant et compacté, peut conserver dix fois plus de données, a une densité de stockage 1000 fois plus élevée, et consomme 100 millions de fois moins d'énergie pour stocker la même quantité de données qu'un disque. Aussi, un dispositif de stockage de données basé sur l'ADN serait minuscule :une année de données mondiales peut être stockée dans seulement quatre grammes d'ADN.
Mais stocker des données avec de l'ADN implique également des coûts exorbitants, mécanismes d'écriture et de lecture douloureusement lents, et est sensible aux erreurs de lecture.
Les nanopores à la rescousse
Une façon consiste à utiliser des trous de taille nanométrique appelés nanopores, quelles bactéries pénètrent souvent dans d'autres cellules pour les détruire. Les bactéries attaquantes utilisent des protéines spécialisées connues sous le nom de "toxines formant des pores" qui s'accrochent à la membrane de la cellule et forment un canal en forme de tube à travers elle.
En bio-ingénierie, les nanopores sont utilisés pour "détecter" les biomolécules, comme l'ADN ou l'ARN. La molécule traverse le nanopore comme une ficelle, piloté par la tension, et ses différents composants produisent des signaux électriques distincts (une "signature ionique") qui peuvent être utilisés pour les identifier. Et en raison de leur grande précision, les nanopores ont également été testés pour la lecture d'informations codées par l'ADN.
Néanmoins, les nanopores sont toujours limités par les lectures à basse résolution, un vrai problème si les systèmes à nanopores doivent un jour être utilisés pour stocker et lire des données.
Nanopores d'aérolysine
Le potentiel des nanopores a inspiré les scientifiques de la Faculté des sciences de la vie de l'EPFL à explorer les nanopores produits par la toxine porogène aérolysine, fabriqué par la bactérie Aeromonas hydrophila. Animé par Matteo Dal Peraro à la Faculté des sciences de la vie de l'EPFL, les chercheurs montrent que les nanopores d'aérolysine peuvent être utilisés pour décoder des informations binaires.
En 2019, Le laboratoire de Dal Peraro a montré que les nanopores peuvent être utilisés pour détecter des molécules plus complexes, comme les protéines. Dans cette étude, Publié dans Avancées scientifiques , l'équipe s'est associée au laboratoire d'Alexandra Radenovic (École d'ingénieurs de l'EPFL) et a adapté l'aérolysine pour détecter des molécules sur mesure précisément pour être lues par ce pore. La technologie a été déposée sous forme de brevet.
Les molécules, connus sous le nom de polymères numériques, ont été développés dans le laboratoire de Jean-François Lutz à l'Institut Charles Sadron du CNRS à Strasbourg. Ils sont une combinaison de nucléotides d'ADN et de monomères non biologiques conçus pour traverser les nanopores d'aérolysine et émettre un signal électrique qui pourrait être lu comme une donnée.
Les chercheurs ont utilisé des mutants d'aérolysine pour concevoir systématiquement des nanopores pour lire les signaux de leurs polymères informationnels. Ils ont optimisé la vitesse des polymères traversant le nanopore afin qu'il puisse émettre un signal identifiable de manière unique. "Mais contrairement aux lectures conventionnelles de nanopores, ce signal a délivré une lecture numérique avec une résolution sur un seul bit, et sans compromettre la densité de l'information, " dit le Dr Chan Cao, le premier auteur de l'article.
Pour décoder les signaux de lecture, l'équipe a utilisé l'apprentissage en profondeur, ce qui leur a permis de décoder jusqu'à 4 bits d'informations des polymères avec une grande précision. Ils ont également utilisé l'approche pour identifier aveuglément des mélanges de polymères et déterminer leur concentration relative.
Le système est considérablement moins cher que d'utiliser l'ADN pour le stockage de données, et offre une endurance plus longue. En outre, il est "miniaturisable, " ce qui signifie qu'il pourrait facilement être intégré dans des dispositifs portables de stockage de données.
« Il y a plusieurs améliorations sur lesquelles nous travaillons pour transformer cette plate-forme bio-inspirée en un produit réel pour le stockage et la récupération de données, " dit Matteo Dal Peraro. " Mais ce travail montre clairement qu'un nanopore biologique peut lire des analytes hybrides ADN-polymère. Nous sommes ravis car cela ouvre de nouvelles perspectives prometteuses pour les mémoires à base de polymères, avec des avantages importants pour l'ultra haute densité, stockage à long terme et portabilité des appareils."