L'humanité crée d'énormes quantités de données chaque jour, des milliards d'e-mails et de mises à jour sur les réseaux sociaux, nouveaux sites Web, documents, images, et des mégadonnées scientifiques et commerciales représentant des pétaoctets de besoins de stockage et au-delà. Il est bien connu que les acides nucléiques, l'ARN et l'ADN qui codent les protéines nécessaires à la construction des êtres vivants sont apparemment assez efficaces pour stocker des informations et s'inspirer ainsi de ce domaine, une équipe indienne écrit dans le Journal international des nano et biomatériaux comment la mémoire étendue des acides nucléiques (NAM) pourrait être l'avenir de la technologie de stockage de données.
Par comparaison, un disque dur d'ordinateur a une capacité de stockage d'informations de 10 à 13 bits de données par centimètre cube, c'est environ 1,25 téraoctets. NAM a le potentiel de stocker un million de fois ce montant dans le même volume, 1, 250, 000 téraoctets, ou 1250 pétaoctets, 1,25 exaoctet. Si l'on considère les informations contenues dans les « quatre grands » d'Internet :Google, Amazone, Microsoft, et Facebook, c'est la somme de toutes les données qu'ils ont stockées dans un seul centimètre cube de NAM.
Saptarshi Biswas du Département d'informatique et d'ingénierie, à l'Institut de technologie Meghnad Saha, à Calcutta, Inde, et ses collègues Subhrapratim Nath, Jamuna Kanta Sing, et Subir Kumar Sarkar de l'Université de Jadavpur ont maintenant développé une nouvelle approche d'encodage leur permettant de parler de NAM étendu. Leur méthode mappe efficacement des données binaires sur un système hybride de nucléotides génétiques standard ainsi qu'en utilisant des nucléotides génétiques non standard (en plus du G, UNE, T, et C (guanosine, adénosine, thymine, et cytosine, de l'ADN) pour obtenir une plus grande capacité de données. L'appariement naturel des bases GATC dans l'ADN est ce qui nous donne la double hélice et permet de coder l'information pour la production de protéines que ce soit dans un champignon, une bactérie, une rose, ou un être humain.
L'équipe a ajouté deux nouveaux nucléotides non standard, pour leur donner des appariements supplémentaires Ds-Px (une thiénylimidazopyridine et une nitropropynylpyrrole) et Im-Na (une imidazopyrimidine et une naphtyridine). Ce sont des unités très stables pour compléter les appariements de A-T et C-G dans un acide nucléique naturel. Ils sont également très sélectifs dans une telle molécule, spécifiquement l'ADN. Cela pourrait potentiellement porter la capacité de stockage hypothétique de ce seul centimètre cube de NAM à plusieurs fois la valeur de 1,25 exaoctet mentionnée ci-dessus. En effet, l'équipe écrit que la RAM étendue aurait une capacité de plus de 630 exaoctets par gramme d'ADN, ce qui, en supposant que l'ADN a une densité de 1,7 gramme par centimètre cube, est supérieur à 370 exaoctets par centimètre cube de NAM étendu. c'est près de 300 fois le total des informations détenues par les quatre grands d'Internet aujourd'hui.