OpenAI travaille depuis un an sur un outil de détection de textes générés par ChatGPT. Malgré une efficacité annoncée de 99,9%, cet outil reste confidentiel, suscitant débats et inquiétudes. Retour sur les raisons de cette décision et ses implications potentielles.
L’outil de détection d’OpenAI, une promesse tenue en suspens
Depuis un an, OpenAI développe un outil de détection pour identifier les textes générés par ChatGPT avec une efficacité annoncée de 99,9%. Pourtant, ce détecteur de contenus reste inaccessible au public. Selon le Wall Street Journal, bien que l’outil soit prêt depuis environ un an, OpenAI hésite à le déployer. Suite à cet article, l’entreprise a confirmé l’existence de l’outil et ses limites, tout en indiquant poursuivre son travail sur le sujet.
Les craintes et les limitations d’OpenAI
L’une des principales craintes d’OpenAI est que les utilisateurs se détournent de ChatGPT en sachant qu’il est facilement détectable. Une enquête interne a révélé que cette technologie pourrait dissuader un tiers des utilisateurs, notamment dans les milieux scolaire, académique et professionnel. Actuellement, ChatGPT ne marque pas son contenu avec un “tatouage numérique”. L’outil de détection utilise cependant des filigranes invisibles, qui pourraient être détectés et attribués à ChatGPT avec une probabilité de 99,9% lorsqu’un texte contient suffisamment de mots.
Cependant, il existe des moyens de contourner ces filigranes, tels que la traduction via Google ou l’ajout de caractères spéciaux avant leur suppression. De plus, à long terme, la méthode de filigrane pourrait être découverte, ce qui soulève des préoccupations supplémentaires, notamment sur la potentielle discrimination envers les utilisateurs non anglophones.
Détection et contournement : un défi technologique
OpenAI n’est pas la première à se confronter à ce défi. Dans le passé, elle a testé un autre outil de détection, sans filigrane, qui n’a réussi que dans 26% des cas. Google a également lancé son propre outil, SynthID, pour détecter le texte généré par son IA Gemini. D’autres solutions comme Originality AI, Content at Scale et ZeroGPT tentent de relever ce défi, mais la question reste : ces outils sont-ils réellement fiables ?
À mon avis, tous les outils de détection de contenu généré par IA sont contournables en raison de la créativité et de la masse d’utilisateurs. Il est probable que des vidéos explicatives fleuriront sur YouTube, montrant comment contourner ces systèmes. Une question éthique se pose également : faut-il systématiquement signaler qui a créé le contenu ? Par ailleurs, la détection concerne ici les textes entièrement générés par IA, mais si un texte est modifié et approprié par un utilisateur, quel sera alors le taux de détection ? La fiabilité de ces outils reste incertaine face aux nombreuses stratégies possibles pour masquer l’origine d’un contenu.
Vers un futur tracé par les filigranes numériques
L’essor du filigrane numérique comme standard de traçabilité des œuvres générées par IA semble inévitable. Malgré les défis technologiques et éthiques, OpenAI et d’autres acteurs de l’industrie travaillent sans relâche pour offrir des solutions efficaces. Dans un avenir proche, ces outils pourraient devenir des normes, garantissant une transparence et une responsabilité accrues dans l’utilisation des IA génératives.