Confidentialité des élèves : ce que tout enseignant doit savoir sur l'IA et le RGPD
Données sensibles en classe, outils d'IA et la réglementation européenne : les questions à poser avant de téléverser une seule copie sur une plateforme externe.
La conversation habituelle en salle des profs, quand quelqu'un mentionne des outils d'IA, saute généralement la question la plus importante : qu'arrive-t-il aux données des élèves ? La réponse courte, c'est qu'il leur arrive tout, et que ce tout est encadré par une réglementation qui n'est ni optionnelle ni interprétable.
Cet article n'est pas un traité juridique. C'est le guide pratique dont un·e enseignant·e a besoin pour prendre des décisions raisonnables : quels types de données vous manipulez sans vous en rendre compte, quelles obligations votre établissement a vis-à-vis d'elles, quelles questions poser à n'importe quel outil avant de l'utiliser avec un seul travail réel, et où se trouve la ligne à ne pas franchir.
Ce qui compte comme donnée personnelle d'un·e élève
La première chose à comprendre — et que beaucoup d'enseignant·es négligent — est l'étendue de la définition. Le RGPD considère comme donnée personnelle toute information pouvant être associée à une personne identifiée ou identifiable.
Cela inclut l'évident : nom et prénom, date de naissance, numéro d'identifiant national si vous le détenez, adresse, photo, téléphone. Mais cela inclut aussi des choses qui ne ressemblent pas à des « données » au sens administratif :
- Les réponses à un devoir : une rédaction est une donnée personnelle de l'élève qui l'a écrite.
- Les notes et les commentaires d'évaluation.
- Les photos de la classe, même prises de dos ou seulement des mains.
- Les enregistrements audio de présentations.
- Le dossier scolaire, les observations du tuteur, les annotations du carnet.
Et, à l'intérieur des données personnelles, il existe une catégorie spécialement protégée : les données sensibles ou « catégories particulières ». Ce sont les données portant sur l'origine ethnique, les opinions politiques, les convictions religieuses, l'appartenance syndicale, la santé, la vie sexuelle ou l'orientation sexuelle, les données génétiques ou biométriques. La protection supplémentaire dont elles bénéficient est importante.
Il y a une zone grise fréquente : les rapports psychopédagogiques, les adaptations curriculaires, les diagnostics liés à des besoins éducatifs particuliers. Ce sont des informations de santé qui entrent dans la catégorie sensible. Manipuler ces données exige des mesures renforcées.
La couche supplémentaire : ce sont des mineur·es
À tout ce qui précède s'ajoute une protection supplémentaire quand il s'agit de mineur·es. En France, l'âge à partir duquel un·e mineur·e peut consentir seul·e au traitement de ses données dans la société de l'information est de 15 ans (Loi Informatique et Libertés). En dessous, le consentement doit être donné par les titulaires de l'autorité parentale.
Cela signifie qu'un·e enseignant·e du primaire ou du collège manipule presque exclusivement des données pour lesquelles les élèves ne peuvent pas consentir seul·es. Tout outil utilisé avec ces données doit s'appuyer sur un consentement formalisé de la famille.
Pour les plus de 15 ans, l'élève peut consentir, mais l'établissement reste responsable du traitement. La responsabilité ne disparaît jamais.
Qui est responsable de quoi
Une distinction importante est souvent confondue :
- Le responsable du traitement est celui qui décide quelles données sont traitées et pour quoi. En éducation, c'est presque toujours l'établissement (ou, indirectement, l'autorité dont il relève).
- Le sous-traitant est l'outil ou l'entreprise externe qui traite ces données pour le compte du responsable.
Quand un·e enseignant·e téléverse des copies sur un outil externe de correction, l'établissement reste responsable. L'outil est sous-traitant. Pour que cette relation soit légale, il faut un contrat de sous-traitance signé entre l'établissement et l'éditeur de l'outil. Sans ce contrat, l'usage n'est pas conforme.
Si un outil ne peut pas vous montrer un contrat de sous-traitance standard prêt à être signé par votre établissement, ne l'utilisez pas avec des données réelles d'élèves. Point.
C'est probablement le filtre le plus utile qui existe. Les outils sérieux qui s'adressent aux établissements ont ce contrat préparé et le fournissent sans friction. Ceux qui ne le font pas ne sont pas une option.
Les questions à poser à tout outil
Avant de téléverser un seul travail réel sur une plateforme externe d'IA, il existe un court questionnaire à appliquer. Si une réponse ne vous convainc pas, cherchez une alternative :
1. Où les données sont-elles stockées physiquement ?
Cela importe parce que le RGPD encadre le transfert international de données hors de l'Espace économique européen. Si les serveurs sont aux États-Unis, en Inde ou dans tout pays sans niveau de protection adéquat, il faut soit un mécanisme légal spécifique (clauses contractuelles types, décisions d'adéquation), soit éviter cet outil.
La réponse idéale est « dans l'UE ». La réponse acceptable est « aux États-Unis avec clauses contractuelles types et certification dans un cadre spécifique ». La réponse vague (« dans le cloud ») est une raison de ne pas continuer.
2. Combien de temps sont-elles conservées ?
Le principe de minimisation dit qu'il faut conserver uniquement ce qui est nécessaire à la finalité déclarée. Un outil qui conserve vos copies corrigées indéfiniment, ou qui ne précise pas la durée, ne respecte pas ce principe.
Ce qui est raisonnable, c'est que les données soient conservées pendant la durée de la relation contractuelle avec l'établissement et qu'elles soient supprimées automatiquement à la fin (ou au terme d'une période définie).
3. Sont-elles utilisées pour entraîner des modèles ?
Cette question est critique avec les outils d'IA. Certains services utilisent les données qu'on leur envoie pour améliorer leurs modèles. Si la réponse est oui — même si les données sont « anonymisées », ce qui est techniquement compliqué —, ce ne sont pas une option pour des données de mineur·es.
La réponse attendue est un non sans ambiguïté, idéalement garanti contractuellement : « les données du client ne sont jamais utilisées pour l'entraînement des modèles ».
4. Quelles mesures de sécurité technique sont en place ?
Chiffrement au repos, chiffrement en transit (HTTPS), contrôles d'accès, journaux d'audit. Ce sont les mesures de base. Un outil qui ne peut pas les décrire ou qui les décrit vaguement n'a pas un niveau de sécurité sérieux.
5. Que se passe-t-il si une famille exerce ses droits ?
Le RGPD donne aux familles — ou aux élèves majeur·es au regard du consentement numérique — des droits concrets : accès, rectification, effacement, portabilité. Si une famille demande quelles données la concernant figurent sur une plateforme, votre établissement doit pouvoir répondre. Cela signifie que l'outil doit avoir un processus clair pour que l'établissement traite ces demandes.
Anonymisation : la nuance importante
Une solution parfois proposée comme raccourci est « je téléverse anonymisé ». L'idée est de retirer le nom de l'élève et d'envoyer seulement le contenu de la copie.
Cette pratique réduit le risque mais n'est pas une anonymisation au sens strict du RGPD. Anonymiser réellement implique qu'il soit impossible — pas seulement difficile — de réidentifier la personne. Une copie aux réponses uniques, contenant des informations personnelles entre les lignes, avec le contexte de la classe et la date, est presque toujours réidentifiable.
Ce que l'on fait en « retirant le nom » s'appelle de la pseudonymisation, et les données pseudonymisées restent des données personnelles au regard du RGPD. Le risque baisse, les obligations ne disparaissent pas.
Pour que l'anonymisation soit réelle, il faudrait briser le lien avec le contexte de la classe, les camarades, les dates. Impossible en pratique pour la correction académique.
La ligne rouge : données sensibles et outils non certifiés
Il existe un consensus assez clair dans le secteur éducatif sur l'endroit où passe la ligne à ne pas franchir :
- Rapports psychopédagogiques, diagnostics, informations de santé : jamais à des outils externes sans certification spécifique pour les données de santé.
- Images et enregistrements audio identifiables d'élèves : seulement à des outils qui respectent strictement les cinq questions précédentes et avec consentement explicite des familles pour cette finalité précise.
- Données de mineur·es de moins de 15 ans sans consentement familial spécifique pour l'usage de l'outil : non, directement.
Franchir ces lignes n'est pas un risque abstrait. La CNIL sanctionne, les familles réclament, les établissements perdent la confiance.
Ce que l'on peut faire avec une sécurité raisonnable
Tout n'est pas restriction. Il existe un large espace où l'IA apporte une valeur réelle avec un risque maîtrisé :
- Matériel généré par l'enseignant·e (exercices, schémas, exemples) qui ne contient pas de données d'élèves. Ici, pas de problème RGPD.
- Travaux d'élèves transmis à des outils avec contrat de sous-traitance signé, clauses claires, stockage dans l'UE et engagement explicite de non-entraînement.
- Analyses agrégées et statistiques de classe sans niveau d'identification individuelle.
La différence entre un usage légalement correct et un usage problématique n'est pas dans la technologie. Elle est dans le cadre contractuel et technique autour de la technologie.
Une conversation en attente dans la plupart des établissements
Une observation finale, sans dramatisation. La réalité pratique de la plupart des établissements en 2026 est que l'IA est entrée par la porte de derrière. Des enseignant·es qui essaient individuellement des outils, téléversent des travaux, obtiennent des résultats utiles, et continuent sans que la direction, le délégué à la protection des données, ou les familles aient de visibilité.
Ce n'est pas tenable. La conversation doit avoir lieu à un moment, et il vaut mieux qu'elle ait lieu avant qu'une réclamation ou un contrôle ne la force. La conversation utile inclut la direction, le délégué à la protection des données, un·e représentant·e des familles et les enseignant·es qui utilisent ou veulent utiliser des outils d'IA.
Le résultat de cette conversation n'a pas à être l'interdiction de l'IA. Cela peut être un cadre clair indiquant quels outils sont approuvés pour quel type de données, avec quelle information aux familles et selon quelles procédures.
La peur paralysante et la liberté chaotique sont les deux pires options. Il existe un point d'équilibre raisonnable, et il vaut la peine de le construire ensemble.