Intervention de Gérard Roucairol

Réunion du jeudi 1er juillet 2021 à 9h30
Office parlementaire d'évaluation des choix scientifiques et technologiques

Gérard Roucairol, membre de l'Académie des technologies :

Les modèles ne sont pas tous basés sur l'intelligence artificielle. Il existe d'autres types de modèles, beaucoup plus directs.

Deux types de raisonnement sont possibles. Dans le raisonnement déductif, on va du général vers le particulier et ces modèles sont moins soumis à l'incertitude dès lors qu'ils ont été validés. Les modèles dits inductifs, comme ceux que vous évoquiez, prennent un échantillon de données et essaient d'en faire une généralisation, ce qui, dans le champ de l'intelligence artificielle, correspond à l'apprentissage. Ces modèles sont bien entendus plus soumis à questionnement et il existe des outils pour essayer de valider les méthodes inductives – ainsi que les méthodes déductives pour valider les modèles généraux, qu'il ne faut pas oublier. La météorologie est basée sur des modèles déductifs, des modèles qui n'ont pas de biais, car ils relèvent de la physique des écoulements de fluides. Les difficultés ne viennent pas que des aspects liés au processus inductif qui part d'un échantillon.

Je ne sais pas s'il existe un consensus sur l'échec de Watson, en particulier pour la santé. Pour en avoir discuté notamment avec des équipes d'IBM et avoir vu des papiers rédigés par des gens d'IBM, je crois que le problème provient, comme toujours, de ce que n'importe qui ne peut pas assurer l'apprentissage supervisé utilisé dans Watson, c'est-à-dire un apprentissage où le sens des données est indiqué par l'homme. Pour faire de l'inférence, pour prédire une maladie à quelqu'un à partir des données, il faut que des experts aient validé les données et qu'ils leur aient donné un sens sémantique. Par exemple, pour prédire un AVC, les spécialistes pensent qu'il faut de l'ordre d'un million d'électrocardiogrammes annotés par des cardiologues, pas par n'importe qui. Il faut que des experts interviennent.

Ces systèmes sont extrêmement chers, extrêmement lourds à mettre en œuvre et leur paramétrage ne peut pas être confié à quelqu'un qui passe dans un couloir. Je dis cela parce que c'est souvent ce qu'il s'est passé avec Watson appliqué à la santé : le travail d'annotation des données a été confié à des étudiants, à des petites mains. Or ce n'est pas si facile. En général, les start-ups ne savent pas faire parce qu'elles ne peuvent pas gérer un million d'électrocardiogrammes et les faire annoter par des cardiologues patentés. Tout cela a un coût dont il faut être conscient.

Aucun commentaire n'a encore été formulé sur cette intervention.

Cette législature étant désormais achevée, les commentaires sont désactivés.
Vous pouvez commenter les travaux des nouveaux députés sur le NosDéputés.fr de la législature en cours.