Je suis d'accord en tout point avec ces remarques. Nous attendons avec grand intérêt le rapport de l'Académie des technologies, qui contribuera à consolider et nourrir le nôtre.
Sur ces questions de statistiques, l'un des écueils à éviter est la tentation du bricolage pour obtenir un résultat. Ce piège est d'autant plus présent dans le cas des réseaux de neurones, qui apportent beaucoup de souplesse. Certaines personnes se ont ainsi fait une spécialité d'agglomération de données non structurées, qu'elles vont chercher absolument n'importe où, en connectant tout à tout. Ces techniques sont, certes, passionnantes mais doivent être manipulées avec prudence. L'exemple que vous donnez de l'annonce de la probabilité de développer un cancer à partir de données très peu robustes rejoint un exemple de vulgarisation scientifique que je cite régulièrement et que j'avais rencontré enfant lorsque je lisais Stephen Jay Gould. Dans l'une de ses chroniques, il raconte son rapport avec la statistique et le moment où il avait lui-même consulté les statistiques correspondant à son propre cancer, au sortir de l'opération. Il avait alors constaté, en consultant la littérature, que la situation était plutôt inquiétante : la médiane était basse, les risques de récidive très forts. Mais en y réfléchissant mieux et en tenant compte de toute la distribution statistique, il s'était rendu compte qu'il existait une queue de distribution très étalée dans les survies et en avait déduit que l'important n'était pas la médiane mais de savoir s'il était dans la petite frange regroupant tous les facteurs positifs. Il a finalement pu se rassurer comme ça et n'est effectivement pas mort de ce cancer. Cette anecdote montre combien l'interprétation de la statistique est dangereuse si l'on n'est pas expert et si l'on ne se plonge pas vraiment dans le domaine. On a coutume de dire que de toutes les branches mathématiques, c'est la plus traître parce que si l'on ne connaît pas la discipline à laquelle elle s'applique, alors on va « droit dans le mur » en termes d'interprétation. Avec l'intelligence artificielle, les risques sont décuplés. Appliquer la même méthode de raisonnement statistique d'un domaine à l'autre peut conduire à des erreurs. C'est la raison pour laquelle les secteurs ont de l'avenir devant eux, l'important étant que chacun parvienne à augmenter son expertise. Des grands acteurs qui s'occupent de passer des contrats avec des institutions pour y installer un logiciel d'intelligence artificielle le disent clairement : en fonction du domaine et de la façon dont est organisée la structure, il faut à chaque fois reprendre la discussion presque à zéro.