La transparence vous dit que c'est l'IA. Elle ne peut pas vous dire comment lui faire confiance.

par Sam Rogers
12 min de lecture
transparency
trust
governance
regulated-industries
education
La transparence vous dit que c'est l'IA. Elle ne peut pas vous dire comment lui faire confiance.

La Commission européenne a publié ses projets de lignes directrices sur les obligations de transparence de l'Article 50 du Règlement sur l'IA pour consultation des parties prenantes, et la période de consultation se termine aujourd'hui. En tant que PDG de PAICE.work PBC, j'ai déposé une réponse, concernant la perspective de mesure et de vérification que nous développons en interne. Ces lignes directrices sont non contraignantes et explicitement provisoires ; la Commission peut les amender, et seul le Tribunal de justice peut donner une interprétation faisant autorité, mais les obligations qu'elles interprètent entrent en vigueur le 2er août 2026. C'est donc au moment de la consultation qu'il faut obtenir la bonne interprétation.

En travaillant sur ce projet pour rédiger ces commentaires, je suis revenu sans cesse sur le même vide. L'Article 50 peut obliger un système à déclarer qu'il est artificiel. Il ne peut cependant pas garantir que cette déclaration parvienne à un humain, qu'elle survive au passage du temps ou qu'elle produise un jugement réel chez celui qui la reçoit. Le premier est un problème d'étiquetage, et le Règlement sur l'IA offre une réponse crédible. Les trois autres sont des problèmes structurels et comportementaux, et la réglementation les reporte silencieusement à vous.

Veuillez noter qu'il ne s'agit pas de conseils juridiques et que vous devez toujours consulter vos propres équipes juridiques et de conformité avant d'agir sur les obligations de transparence du Règlement sur l'IA. Les projets de lignes directrices discutés ici ont été publiés pour consultation et peuvent changer avant adoption.

Ce que présuppose l'Article 50

L'Article 50 constitue le niveau de transparence du Règlement sur l'IA, la catégorie de systèmes qui présentent un risque non pas par ce qu'ils décident, mais par ce qu'ils dissimulent. Les projets de lignes directrices détaillent quatre obligations. L'Article 50(1) couvre l'IA interagissant directement avec des personnes : les fournisseurs doivent concevoir le système de sorte que toute personne interagissant avec lui soit informée qu'elle traite avec une IA. L'Article 50(2) couvre le contenu synthétique : les fournisseurs doivent marquer les sorties générées d'une manière détectable et lisible par machine. L'Article 50(3) couvre la reconnaissance des émotions et la catégorisation biométrique, où les déployeurs doivent informer les personnes exposées. L'Article 50(4) couvre les deep fakes et les textes générés par IA publiés à l'intention du public sur des questions d'intérêt général. Une cinquième disposition, l'Article 50(5), établit la règle horizontale pour tous : l'information doit être claire, distinguable, accessible et fournie au plus tard lors de la première interaction ou exposition.

Chacune de ces obligations repose sur une seule hypothèse. Un humain lit un étiquetage clair au moment du premier contact et agit en conséquence. Cette hypothèse est erronée de trois manières différentes, et chacune est devenue une section de ma contribution.

L'étiquette peut ne jamais atteindre un humain

Le projet présuppose que la divulgation est lue par la personne qu'elle est censée protéger. De plus en plus, ce n'est pas le cas. Le premier, et parfois unique, lecteur d'une divulgation est un agent autonome agissant au nom de quelqu'un : un agent de recherche, un agent commercial, un assistant personnel qui communique avec le chatbot du service clientèle d'un fournisseur pour que son propriétaire n'ait pas à le faire. L'humain lit le résumé de l'agent, pas l'interface originale.

Ceci crée une contradiction au sein même des lignes directrices. Le paragraphe 35 stipule que les marquages lisibles par machine ne peuvent pas satisfaire à l'Article 50(1) parce qu'ils ne sont pas perceptibles par les utilisateurs au point d'interaction. Les paragraphes 33 et la note de bas de page 20 rendent toutefois favorables les identifiants d'IA vérifiables basés sur eIDAS et les Portefeuilles d'identité numériques de l'UE. Ces deux éléments tirent dans des directions opposées. Lorsque l'exposition est médiatisée par un agent, un indice visuel ou auditif uniquement humain n'atteint jamais la personne, car celle-ci lit un résumé relayé. La couche lisible par machine est la condition préalable à la perception humaine, pas une alternative à celle-ci. Notre commentaire demandait à la Commission de le dire clairement et d'étendre le paragraphe 28, qui couvre un agent qui se divulgue, à la chaîne de relais où un agent doit présenter la divulgation d'un autre système à un humain.

Il existe une version plus profonde de ce problème qui se situe juste au-delà du cadre de l'Article 50. L'Article 50 régit l'acte de divulgation du fournisseur, pas le fait qu'un agent médiateur le relaie fidèlement. Une divulgation correctement marquée peut toujours être omise ou déformée par un intermédiaire compromis, et la personne en bout de chaîne n'en sait rien. La réglementation cartographie la couche de contenu, la question de savoir si le contenu est marqué, et non encore la couche de relais, savoir si ce marquage survit aux agents entre le système et l'humain. C'est un problème de robustesse et d'intégrité de l'agent plutôt qu'un problème de transparence, et il vaut la peine d'être nommé pendant que le projet est encore soumis à révision. Dans notre soumission, j'ai réussi à résister à l'envie de mentionner notre solution à ce type de problème via notre standard ouvert GuideCheck (CC BY 4.0).

Un étiquetage qui se dégrade

Le deuxième défaut est le temps. Le projet traite la conformité comme un jugement unique, fixé au moment où le fournisseur le rend. Deux des obligations ne peuvent pas fonctionner ainsi.

L'Article 50(1) prévoit une exception pour les interactions manifestement artificielles. Mais l'« évidence » n'est pas stable, elle change assez rapidement. Le paragraphe 42 du projet concède qu'une reproduction réaliste diminuerait cette évidence, puis traite néanmoins cette évaluation comme étant statique et interne au fournisseur. Un assistant vocal qui était manifestement synthétique au lancement peut devenir indiscernable d'un humain après une mise à niveau de modèle de routine : même déploiement, même décision de divulgation, mais l'exemption est silencieusement caduque. L'Article 50(2) présente la même situation concernant le marquage. Les paragraphes 77 et 78 acceptent que l'état de l'art et les techniques adverses évoluent, ce qui signifie qu'une affirmation de robustesse valide aujourd'hui se dégrade à mesure que les attaques progressent.

Il existe un lien concernant la manière dont la conformité est démontrée. Le paragraphe 74 définit l'efficacité et la robustesse comme des propriétés observables et externes : savoir si les marques survivent à une transmission réaliste, à un recodage, un recadrage et à une manipulation adversaire dans le monde réel. Le projet ne précise jamais comment un fournisseur peut les démontrer, laissant l'auto-attestation du fournisseur comme valeur par défaut. Cependant, les tests internes d'un fournisseur, aussi rigoureux soient-ils, ne peuvent établir une efficacité externe. Nous avons soutenu que la conformité devrait reposer sur une évaluation indépendante et vérifiable extérieurement, signalée par modalité à un seuil de confiance déclaré, et que cette affirmation devrait être horodatée, datée et réévaluée par intervalles, avec un déclencheur de révision en cas de changement matériel des capacités, plutôt qu'une déclaration de conformité qui persiste inchangée.

C'est exactement le modèle derrière AI Posture, la spécification ouverte que nous maintenons (CC BY 4.0, sans revendication commerciale sur le résultat) pour traiter une affirmation de sécurité et de gouvernance comme une déclaration d'état vérifiable extérieurement et horodatée plutôt qu'un certificat unique. Une posture est vraie à une date et réaffirmée selon une cadence. La conformité en matière de transparence a la même structure temporelle, et les projets de lignes directrices auraient été plus solides en la nommant. C'était la seule référence externe dans notre soumission, placée contre le paragraphe dont le vide correspond, plutôt que dispersée dans la réponse.

Même un étiquetage parfait n'est pas une compétence

Supposons que les deux défauts structurels aient été corrigés. La divulgation est lisible par machine, elle atteint l'humain par tous les agents de la chaîne, et elle comporte une date d'affirmation récente. Un troisième vide demeure, et c'est celui que PAICE (People + AI Collaboration Effectiveness) existe à mesurer.

Les lignes directrices sont franches quant à la raison d'être de ces obligations. Le but énoncé, tiré du Considérant 132, est de permettre aux gens de prendre des décisions éclairées, de les empêcher de trop dépendre des systèmes d'IA et de leur permettre d'ajuster leur confiance dans le contenu et les interactions en conséquence. Ajuster leur confiance. C'est l'objectif selon les propres termes de la réglementation. Pas être averti, pas voir une étiquette, mais ajuster sa confiance à la hausse ou à la baisse pour correspondre à la fiabilité réelle du système dans cette tâche, à ce moment-là.

Une divulgation remplit un seul rôle bien : elle supprime l'excuse de l'ignorance. Une fois qu'une bannière indique que vous interagissez avec un système d'IA, la personne ne peut plus prétendre qu'elle présumait qu'un humain l'avait écrit. Mais savoir que vous parlez à une IA ne fait rien pour vous rendre bon pour parler à une telle IA. L'étiquette est identique que le système ait raison ou tort à un tour donné. Elle ne signale pas la citation fabriquée, le chiffre donné avec confiance mais erroné d'un ordre de grandeur, le résumé qui omet la clause qui inverse le sens. Calibrer la confiance signifie détecter ces éléments, et aucun avis ne peut accomplir ce travail, car le travail se déroule chez la personne après que la divulgation a été lue et écartée. C'est le même vide qui apparaît sous une revue humaine significative : une réglementation peut exiger qu'un humain examine le résultat de l'IA, mais elle ne peut pas exiger que cette revue soit bonne. PAICE observe le comportement que la divulgation est censée permettre et ne peut pas fournir : si une personne détecte les erreurs injectées, si elle vérifie avant de se fier, si sa confiance suit la preuve plutôt que la fluidité.

Trois couches, une forme

Rédiger ces commentaires signifiait garder à l'esprit quatre types de textes juridiques simultanément : le Règlement contraignant, les Considérants non contraignants qui l'interprètent, les projets de lignes directrices qui interprètent les articles, et un futur Code de pratiques qui portera une présomption de conformité. En tant que lecteur venant du droit américain (et ayant travaillé avec des avocats mais n'ayant jamais étudié le droit formellement), j'ai eu du mal à savoir lequel de ces textes était réellement la loi et comment ils étaient liés. Pour les garder en mémoire pendant mon travail, j'ai modélisé l'Article 50 dans Obligation First, le modèle ouvert que je maintiens pour condenser une hiérarchie juridique multicouche en une forme uniforme : Termes, et les Obligations qu'ils créent ou interprètent.

Dans ce modèle, l'Article 50(2), le Considérant 133 et le paragraphe 69 des lignes directrices semblent être trois types de choses différentes, mais sont tous des Termes. Ce qui diffère, c'est seulement l'instrument auquel chacun appartient et s'il crée une obligation. L'Article 50(2) crée le devoir de marquage. Le Considérant 133 ne crée rien et existe pour être ancré à une interprétation. Le paragraphe 69 appartient à un instrument séparé et non contraignant et est ancré à l'article qu'il explique. De manière cruciale, l'interprétation n'est pas une annulation : une ligne directrice non contraignante peut être ancrée au règlement qu'elle interprète, mais ne peut jamais le contredire ou le remplacer, et seul le Tribunal de justice pourrait émettre une détermination qui lie autoritairement la lecture. Modéliser cette relation encode la réalité juridique directement. Cela a également rendu les défauts structurels ci-dessus plus faciles à voir, car une fois que la hiérarchie des sources est un seul graphique, la question de ce qu'exige une obligation et comment le temps et les agents modifient cette exigence est une seule traversée plutôt qu'un exercice de lecture à travers trois documents dans trois styles de citation.

Le vide que laisse la transparence

L'Article 50 est une bonne réglementation visant un préjudice réel, et les projets de lignes directrices le rendent plus opérationnel. Les infractions peuvent entraîner des amendes allant jusqu'à quinze millions d'euros ou trois pour cent du chiffre d'affaires annuel mondial, les obligations ont donc une réelle portée. Ce que le projet rend visible, presque au passage, c'est la limite de ce que peut accomplir la divulgation. Le Règlement sur l'IA peut exiger une étiquette sur chaque système concerné d'ici août 2026. Il ne peut pas garantir que l'étiquette atteindra un humain, il ne peut pas maintenir la vérité de l'étiquette à mesure que les modèles avancent, et il ne peut pas mettre derrière les yeux des lecteurs un jugement calibré.

Les deux premiers vides sont adressables dans le texte, c'est pourquoi nous avons déposé en tant que société à but non lucratif américaine contribuant un standard ouvert et neutre vis-à-vis du fournisseur au processus réglementaire de l'UE de bonne foi. Le troisième n'est pas un problème de rédaction. La confiance, Calibrated, est une capacité comportementale qui varie d'une personne à l'autre, elle n'est pas liée à un avis, et pour les professionnels dont le travail a de réelles conséquences, c'est la partie qui protège réellement quiconque.

La transparence vous dit que c'est une IA. Savoir quoi en faire est une mesure entièrement différente.

Vous souhaitez comprendre votre propre profil de préparation ? Effectuez l'évaluation PAICE pour découvrir vos forces et vos opportunités.

Lecture recommandée

Curieux mais pressé ?

Faites le PAICE Pulse en 3 minutes — une vérification rapide qui cartographie votre perception de votre posture de collaboration IA. Aucune connexion requise.