Il y a une multitude de brins d'ADN dans une seule capsule. On reproduit le brin à de très nombreux exemplaires, idéalement autant que d'utilisations prévues de la donnée, car la lecture du brin conduit à le détruire. Le 23 novembre dernier, les Archives nationales ont stocké sur ADN la Déclaration des droits de l'homme et du citoyen de 1789 ainsi que la Déclaration des droits de la femme et de la citoyenne, à plus de 100 milliards d'exemplaires, dans une capsule métallique de 18×5 millimètres, conçue par la société Imagene.
On utilise la soudure laser pour fermer la capsule, avec inscription d'un QR Code pour retrouver les données plus facilement. L'ADN est stocké dans un milieu combinant de l'argon et de l'hélium, entre deux petites plaques de verre, pour éviter les dégradations.
L'accès à l'information stockée, qui passe par le séquençage de l'ADN est également un moment critique. Le séquençage prenait des mois voire des années. Désormais il prend quelques heures, avec des machines très puissantes, comme le séquenceur « Illumina ». Le coût pour déchiffrer un génome humain était de plus de 100 millions de dollars il y a 20 ans. Il est de l'ordre de 1 000 dollars désormais.
Il existe toutefois d'importants freins au développement du stockage de données sur ADN. Les deux opérations cruciales de synthèse et de séquençage sont encore chères et chronophages, même si l'on enregistre des progrès d'année en année. On estime que, pour être compétitif, il faudrait aujourd'hui réduire les coûts de stockage d'un facteur 1 000 sur les données dites « froides » et d'un facteur de 100 millions sur la synthèse. La donnée froide est celle que l'on va chercher peu fréquemment. Le stockage de données sur ADN présente le grand intérêt de permettre de lire ces données dans plusieurs milliers voire millions d'années. L'ADN n'est cependant pas adapté à des lectures et réécritures fréquentes comme nous le faisons aujourd'hui avec des disques magnétiques. Il faut encore plusieurs jours pour écrire et plusieurs heures pour lire des données stockées sur ADN. Le stockage sur ADN n'est donc pas adapté aux données régulièrement consultées. Cependant, les données froides ou chaudes prennent la même place. Il faut pouvoir archiver les données froides, ce qui fera autant de données en moins dans les data center.
La communauté scientifique est très optimiste quant aux progrès à venir du stockage de données sur l'ADN. Les Américains misent beaucoup sur cette technologie. La France s'intéresse au stockage de données sur l'ADN mais aussi sur des polymères, qui fonctionnent de manière assez similaire à l'ADN. On est en pointe sur ce sujet, notamment à Strasbourg. Les polymères présentent l'avantage de pouvoir être fabriqués de manière industrielle très facilement.
Beaucoup d'entreprises françaises, associées à des laboratoires de recherche, sont pionnières dans le domaine du stockage de données sur l'ADN. Ce domaine est d'ailleurs l'un des quatre retenus au titre des programmes exploratoires prioritaires de recherche (PEPR) avec 20 millions d'euros sur 84 mois.
Les chercheurs estiment que l'on peut accélérer considérablement les cycles de lecture/écriture sur l'ADN et que l'on pourrait atteindre prochainement 10 Go en 24 heures. La marge de progression est importante, tant sur l'ADN, qui fait l'objet de recherches depuis 30 ans, que sur les polymères, pour lesquels la recherche est plus récente.
L'écriture de données sur l'ADN est un sujet technique, mais j'ai aussi souhaité entendre un spécialiste des questions éthiques, pour m'assurer que cette technologie ne pose pas de difficulté sur ce plan. L'ADN doit en effet être vu comme un support de stockage, sans aucune intention ni possibilité de l'injecter dans un être vivant.