Le comité d'éthique des données d'éducation s'est autosaisi au début de la crise sanitaire. Il a été alerté par l'un de ses membres, Ignacio Atal, qui est le corapporteur avec Christine Froidevaux de ce comité.
Cette alerte durant la crise du COVID-19 est liée au fait que la crise sanitaire a nécessité la mise en place d'un enseignement à distance pour assurer une continuité pédagogique hors de l'école, hors des établissements scolaires, et à l'utilisation massive et accélérée d'outils numériques, dont des logiciels de provenances plus ou moins sûres. Cela a augmenté les risques déjà existants et a fait émerger de nouveaux risques.
L'avis, que nous avons rendu fin août à M. le ministre, traduit la volonté d'analyser les enjeux d'éthique liés à la collecte, à l'échange, au traitement des données d'éducation, initiée de façon réactive dans l'urgence de la situation.
Notre analyse porte sur les données d'éducation numérique. Elle prend en compte les impératifs de continuité pédagogique, le respect des valeurs au cœur de la mission pédagogique, la protection indispensable des élèves et de la communauté éducative dans son ensemble, pour une confiance partagée ainsi que les opportunités d'évolution du système éducatif.
Notre avis relève trois enjeux d'éthique majeurs de l'usage du numérique dans le domaine éducatif : protéger les données personnelles, garantir la souveraineté numérique nationale et assurer l'égalité d'accès aux ressources et aux compétences numériques.
Le premier enjeu concerne la protection des données personnelles numériques d'éducation des élèves. Nous avons constaté durant le confinement que des données des élèves, de leurs familles, des enseignants ont été produites, traitées, stockées de façon massive par les plateformes numériques. Ces données sont de plusieurs ordres : administratif, institutionnel et personnel.
Nous avons aussi assisté à une augmentation considérable du recours aux mails, aux systèmes de messagerie instantanée, aux réseaux sociaux ainsi qu'aux outils de visioconférence pour communiquer, échanger des informations, faire un cours ou travailler de façon collaborative.
Toutes ces interactions ont produit massivement des données stockées par des fournisseurs de services, potentiellement stockées par toute personne ayant accès à ces espaces d'interactions. Nous avons constaté que, au-delà du domaine scolaire, le nombre de données d'interactions qui ont été produites et stockées a explosé, notamment avec l'utilisation massive des réseaux sociaux par les élèves, mais aussi par les enseignants et bien entendu par leurs parents.
Ces données d'éducation sont spécifiques, car elles concernent des mineurs, mais aussi parce que leur usage se doit de respecter les principes de l'intérêt public du service de l'éducation. Nous considérons donc que ces usages sont hautement sensibles.
Nous avons mis en évidence dans notre avis qu'une donnée d'éducation peut ne plus se rapporter à une personne identifiable si elle a été soumise à un processus d'anonymisation ou si elle a été agrégée aux données d'autres personnes. De telles données ne sont alors plus des données personnelles et ne relèvent plus du règlement général sur la protection des données (RGPD), à l'inverse des données pseudonymisées.
Les données d'éducation sont traitées par de nombreux acteurs à de nombreuses fins, avec des outils très divers. Nous avons observé, durant le confinement, une augmentation spectaculaire de l'usage des outils numériques pour communiquer et partager des données d'éducation. La proportion de recours à des outils non institutionnels est évidemment difficile à évaluer, mais nous savons qu'elle n'a pas été négligeable. Même si le ministère et la Commission nationale de l'informatique et des libertés (CNIL) ont ensuite déployé des outils, fourni des choix d'outils numériques conformes aux règles de protection des données, nous avons pourtant relevé dans notre avis plusieurs risques pour les données d'éducation, relatifs notamment aux libertés fondamentales.
Nous avons noté d'abord un risque d'atteinte à la vie privée : perte de confidentialité des données personnelles des individus ou des groupes d'individus, risque de manipulation, risque de harcèlement, risque d'enfermement, risque de discrimination et enfin, risque de perte d'autonomie.
Nous avons identifié deux tensions : d'une part entre le respect de la vie privée de l'élève et le besoin d'assurer un suivi pédagogique individualisé avec les données personnelles, d'autre part entre une protection juridique exigeante de l'ensemble des données d'éducation et la lourdeur des traitements qui en résulterait.
Dans notre avis, en conclusion de ce premier point sur le respect des libertés fondamentales des acteurs de l'éducation, nous avons formulé neuf recommandations que vous trouverez sur le site de l'Éducation nationale. J'insiste sur deux d'entre elles qui apparaissent comme prioritaires dans cette période de pandémie, malheureusement pas encore terminée.
La première est d'offrir des garanties de sécurité des outils, que l'État recommande ou que l'État met à la disposition des acteurs de l'éducation, et d'évaluer le risque que fait courir leur perte éventuelle de confidentialité. La seconde est de mettre en place des accords avec les acteurs privés dont les élèves et les enseignants utiliseraient les outils, pour garantir « une minimisation » de l'usage de la donnée à une liste définie, par exemple par le ministère, ainsi qu'un effacement régulier de ces données.
Le deuxième enjeu d'éthique est de garantir la souveraineté numérique nationale. La souveraineté numérique signifie, pour résumer, rester maître de nos choix et de nos valeurs. Au-delà des enjeux politiques et économiques, la souveraineté numérique est aussi porteuse de nombreux enjeux d'éthique. Elle implique notamment la question de la formation des acteurs de la communauté éducative, qui doit être, selon nous, prioritaire.
Pendant la période du confinement, le recours à l'offre du privé du EdTech, concernant les moyens numériques pour échanger des documents et converser à distance, a augmenté de façon considérable. Dans le top 20 figurent WhatsApp, Google Suite, Zoom ou Discord. Or il est difficile pour les utilisateurs de s'assurer de la conformité au RGPD de ces outils.
L'offre publique n'a pas pu, dans un premier temps, assurer les flux de demandes ni proposer des outils disposant de toutes les fonctionnalités nécessaires à la continuité pédagogique dans le respect du RGPD.
Or, comme nous le montrons dans notre avis, les données d'éducation constituent une richesse stratégique nationale, une mine d'or pour la recherche et l'innovation. Elles permettent par exemple d'extraire les statistiques sur l'Éducation nationale par villes, par régions, voire à l'échelle d'un pays. Les données agrégées permettent d'évaluer la situation d'un pays en matière d'éducation nationale et d'étudier son évolution dans le temps. La connaissance de ces données par des pays étrangers peut donc constituer une vulnérabilité pour notre pays, si celles-ci étaient utilisées à mauvais escient. Le pays doit pouvoir rester maître de la diffusion de ces informations.
Deux risques relatifs à la souveraineté numérique sont donc identifiés pour les données d'éducation : un risque évident d'ingérence dans nos choix de société qui conduirait à une possible perte d'autonomie et un risque de perte de confidentialité.
Dans cette deuxième catégorie de garantie de la souveraineté, nous avons formulé dans notre avis six recommandations, dont deux nous semblent prioritaires pour garantir la souveraineté numérique en matière d'éducation. La première est d'assurer une offre gratuite, à l'échelle nationale ou européenne, d'outils de téléenseignement de bonne qualité. Ces outils doivent avoir un minimum de fonctionnalités – par exemple des actions de partage collaboratif –, suffisamment de convivialité – rapidité d'exécution, facilité de prise en main – et de la robustesse – les outils doivent être adaptés à un grand nombre de participants –, le tout dans le respect des valeurs d'éthique européennes qui sont portées par le RGPD.
Notre seconde recommandation est d'effectuer une veille et une analyse des principaux outils de communication, de partage, de collaboration qui peuvent être utiles dans le cadre de l'enseignement scolaire, qu'ils soient développés par des acteurs publics ou privés, français ou européens, dès lors qu'ils sont respectueux de nos libertés fondamentales.
Le troisième, et dernier, enjeu d'éthique est d'assurer l'égalité d'accès au numérique. Les données d'éducation sont de plus en plus produites et échangées à travers des outils numériques. Il convient de veiller à ce que cette production et ces échanges puissent être effectués de façon égale pour tous, mais aussi par tous.
Nous avons étudié l'état d'équipement et de connexion numérique. Nous avons vu des inégalités de répartition et d'accès à ces ressources, mais aussi des inégalités d'utilisation de ces moyens numériques liées à un manque de culture numérique. J'insiste vraiment, monsieur le président, sur ce dernier point. Ce manque de culture numérique rend ces moyens difficilement, voire pas du tout, utilisables.
Les compétences numériques de base doivent être maîtrisées par tous les acteurs de la communauté éducative, en particulier les élèves, leurs familles, les enseignants, mais aussi plus généralement par tous les citoyens, pour des usages responsables du numérique. Les questions de la formation au numérique et de la citoyenneté numérique nous semblent fondamentales. Cela se traduit aussi par des besoins de formation au numérique des enseignants, et ils avaient d'ailleurs déjà exprimé ce besoin avant la crise.
Nous indiquons donc un certain nombre d'enjeux d'éthique pour les données d'éducation qui sont relatifs aux accès au numérique, aux compétences numériques et à la citoyenneté numérique. Je vous cite notamment l'accentuation pendant la pandémie des inégalités territoriales, sociales et familiales pour l'accès au numérique et son utilisation, le renforcement des inégalités scolaires par des inégalités d'accès au numérique et par les manques de compétences numériques, la vulnérabilité des élèves et des familles par le manque de compétences numériques pour appréhender les enjeux de modèles économiques des marchands de données numériques. Ce dernier point est extrêmement important. J'ajoute la vulnérabilité des élèves face aux fausses informations, le risque d'exclusion de ceux qui ne pourraient pas devenir des citoyens numériques.
En conclusion, nous formulons concernant ce point six recommandations pour assurer l'égalité d'accès au numérique. L'une d'entre elles nous semble prioritaire : éduquer aux médias et éduquer par les médias. Enfants, familles et enseignants doivent être sensibilisés aux services en ligne, à la vérification des faits et à l'analyse critique des informations disponibles, par exemple à la lutte contre les fausses informations ou les manipulations de l'information.
J'ai rapidement résumé les principaux points de ce rapport, qui est téléchargeable en ligne gratuitement et légalement sur le site de l'Éducation nationale.