OpenAI – ChatGPT : comment détecter les textes écrits par une intelligence artificielle ?

L’émergence de l’intelligence artificielle (IA) qui permet de générer du contenu a facilité la vie de nombreux professionnels. Cependant, bien que très performant, cette technologie peut être utilisée à mauvais escient. Face à cette possibilité, OpenAI, la société-mère du célèbre ChatGPT, a notamment pris la décision de développer un des outils qui aident à détecter les textes générés par IA…
“AI Text Classifier”, le dernier-né d’OpenAI
Qui ne connaît pas OpenAI, la société spécialisée en intelligence artificielle d’Elon Musk et Sam Altman ? Connue notamment pour avoir développé certaines des technologies IA les plus performantes, elle vient de frapper fort en mettant en ligne “AI Text Classifier” le 31 Janvier dernier. Cet outil vise à vérifier l’authenticité d’un texte, autrement dit à détecter s’il a été écrit par une intelligence artificielle ou non.
Aussi ironique que cela puisse paraître, Open AI a conçu “AI Text Classifier” de sorte à lutter contre ses propres produits, à savoir les IA générateurs de contenus comme ChatGPT et d’autres technologies. En effet, face à l’augmentation considérable des textes écrits par des IA dans les milieux scolaire et universitaire, cette société américaine aux 375 salariés a voulu proposer un outil aux enseignants et employeurs pour qu’ils puissent lutter efficacement contre ce fléau.
L’interface de “AI Text Classifier” est simple et se présente comme suit : un formulaire pour y déposer les textes qu’on veut et un bouton “Submit” pour vérifier le texte. Ainsi, après avoir copier-coller votre paragraphe dans l’espace dédié et de l’avoir validé, l’outil est fin prêt à le vérifier. Puis, il donne le niveau de probabilité de rédaction par IA correspondant :
- Very Unlikely (Très improbable)
- Unlikely (Peu probable)
- Unclear if it is (Incertain)
- Possibly (Possible)
- Likely AI-generated (Probablement généré par AI)
Concernant le développement de ce logiciel, OpenAI a déclaré que : “Les résultats peuvent aider à déterminer si un document a été créé par l’IA, mais ne doivent pas être la seule preuve. OpenAI indique que le modèle a été formé sur du texte écrit par l’homme à partir de diverses sources qui ne sont pas nécessairement représentatives de tous les types de texte écrit par l’homme.”
Pour l’instant, “AI Text Classifier” est seulement disponible en anglais. Les autres devront donc attendre avant de pouvoir récolter des résultats corrects et précis sur des textes de leur langue.
Les limites de “AI Text Classifiers”
“AI text classifier”, bien que très ambitieux, présente encore des limites. Des faiblesses que son concepteur, qui rappelons-le, a développé de puissantes IA comme Dall-E ou GPT3, reconnaît également. OpenAI déclare entre autres que son outil “détecte correctement 26% des textes écrits par une IA” mais se trompe en “affirmant que des contenus rédigés par l’homme ont été générés par un IA 9 % du temps”.
Voici quelques-unes des limites de Classifier :
- Vous devez copier et coller au moins 1 000 caractères, ce qui équivaut à environ 150 à 250 mots, pour que l’outil fonctionne ;
- La précision n’est pas le point fort de “AI Text Classifier”, il peut souvent confondre le texte généré par l’IA avec un texte écrit par l’homme ;
- Pour les contenus écrits par des enfants ou les contenus non anglais, l’outil peut commettre des erreurs dues au fait qu’il a été principalement entraîné sur des textes en anglais et écrits par des adultes pour l’instant ;
- Il est également important de préciser que le texte généré par l’IA peut être facilement modifié par l’homme afin d’éviter la détection par les outils comme “AI Text Classifier”.
Autres alternatives à “AI Text Classifiers”
Après avoir cité les failles de ce logiciel d’Open AI, découvrons maintenant quelques alternatives existantes, car il en existe quelques-unes ! Citons par exemple le logiciel DetectGPT, développé par l’université de Stanford dont les premiers tests ont été concluants (95% de réussite). Malheureusement, cet outil n’est pas encore disponible, mais ses concepteurs ont promis de le dévoiler au monde bientôt.
Dans ce contexte s’inscrit également Hive Moderation, une solution développée par les ingénieurs de Hive AI ML, et cela semble fonctionner. Avec une interface simple d’usage, elle permet de détecter avec précision un texte, à condition qu’il contienne plus de 750 caractères, l’idéal étant de 1500. Hive Moderation offre également des statistiques intéressantes comme l’affichage des segments de texte qui ont le plus de contenus artificiels, en plus d’un score global.
Enfin, ZeroGPT peut aussi représenter une alternative intéressante à “AI Text Classifier”, mais son efficacité reste à prouver.
Notez qu’Open AI promet d’intégrer un « watermark » (filigrane) pour faciliter la détection des textes créés par le biais de ses outils. Actuellement, cela n’a pas encore été mis en place, mais on estime que cela se fera dans la prochaine version de ChatGPT.
Si vous souhaitez un autre avis, cette fois-ci sur un outil indispensable pour gérer votre business en ligne, notamment des formations en ligne, découvrez notre avis sur Learnybox.