. – Au lieu de parler de données froides ou chaudes, ne faut-il pas parler de données utiles ? Aujourd'hui, on estime que 60 % des données sont des archives. En entreprise, on estime que 80 % des données ne seront jamais réutilisées. Elles sont stockées un peu par facilité, parce que les supports le permettent, en se disant qu'elles seront peut-être utiles un jour. Actuellement, le coût du gigaoctet est de 26 centimes. Pour une entreprise qui manipule 500 téraoctets, comme c'est le cas de beaucoup de PME, le montant total est de 150 000 euros. Ces données ne servent à rien, mais il faut les sauvegarder, il faut du personnel pour les traiter au quotidien, etc. C'est un coût faramineux. Je dis toujours aux entrepreneurs que s'ils veulent faire des économies, ils peuvent regarder le volume des données qu'ils traitent quotidiennement et dont ils n'utilisent que 20 %.
La construction de data center va se heurter à un énorme frein, parce qu'ils ne contiennent des données que pour cinq à sept ans. C'est bien souvent un investissement important pour pas grand-chose. Certes, les GAFAM peuvent se le permettre, parce qu'ils sont en expansion, mais la grande majorité des entreprises doit s'interroger sur les données qu'il sera bon de garder. C'est d'ailleurs totalement dans l'air du temps : le Règlement général sur la protection des données (RGPD) va contraindre à s'interroger sur les données critiques qu'il faut préserver d'un sinistre et sur celles qui sont moins critiques. La « datasphère » atteint aujourd'hui 175 zettaoctets, sans aucune distinction entre données utiles et inutiles, chaudes et froides. Il faut désormais se pencher sur ce sujet.
J'ai intégré à la note des éléments portant sur la dimension éthique, pour rassurer. Aujourd'hui, qu'est ce qui ne fait pas débat dès qu'on parle d'ADN ? Lors de notre récente rencontre avec l'Académie de médecine sur l'ARN messager, les plus grands spécialistes nous ont expliqué comment entrer dans une cellule, comment changer la polarité de tel ou tel composant, etc. mais cela n'empêchera jamais tout un chacun de dire sur Facebook que les scientifiques qui font cela sont des apprentis sorciers. Il en ira de même pour le stockage sur l'ADN. Il faut répondre en rappelant que l'ADN stocke déjà de l'information : l'ADN humain contient 2,7 zettaoctets d'information. On ne fait qu'utiliser le support ADN pour y mettre un autre type de données, mais le but n'est pas de l'injecter dans l'organisme.