banner
Centre d'Information
Notre équipe tient à fournir des commandes sur mesure

5 façons de détecter le texte écrit par ChatGPT et d'autres outils d'IA

May 28, 2023

Pouvez-vous repérer le texte généré par ChatGPT ? L'IA est utilisée dans les e-mails, les lettres de motivation, les arguments marketing, les dissertations universitaires, le codage et même dans certains reportages. Mais il est préférable de laisser aux ordinateurs eux-mêmes la possibilité de déterminer ce qui est écrit par un humain et ce qui est écrit par un programme informatique.

Les outils de détection ont proliféré à la suite de ChatGPT et des grands modèles de langage alternatifs (LLM). La plupart sont gratuits, mais avec des limites de caractères (quelque chose qui peut être contourné en collant des morceaux de texte à la fois). Un détecteur d'IA peut servir à plusieurs fins, depuis la garantie que le texte que vous écrivez ne semble pas trop générique et guindé jusqu'à la découverte de tromperies de la part des candidats.

Les enseignants sont en tête de liste de ceux qui pourraient utiliser un moyen fiable pour savoir si quelque chose a été écrit par une IA. Et ils ont en effet été parmi les premiers à adopter les logiciels de détection d’IA. Mais tout comme ChatGPT et ses semblables peuvent ne pas être fiables, les détecteurs d’IA le sont également.

Dans le subreddit ChatGPT, un lycéen a récemment demandé conseil (Ouvre dans une nouvelle fenêtre) après avoir été faussement accusé par son professeur d'histoire d'utiliser ChatGPT. L'enseignant n'a pas voulu divulguer quel outil avait été utilisé et, selon l'étudiant, s'est senti justifié de faire cette affirmation car le détecteur l'avait aidé à détecter d'autres textes écrits par l'IA provenant d'autres étudiants qui avaient admis avoir utilisé ChatGPT.

C'est une mise en garde que nous voulions raconter avant de passer à ce tour d'horizon des détecteurs d'IA populaires et de notre expérience avec certains d'entre eux. Étant donné que ChatGPT et autres sont formés pour imiter la façon dont les humains parlent, séparer ce qu'une IA a créé de l'usage courant et ce qui est le texte réel écrit par des personnes n'est pas une tâche facile, même pour l'IA.

Il y a des discussions dans la communauté IA sur les générateurs d'IA, y compris un filigrane (Ouvre dans une nouvelle fenêtre) ou des signaux dans le texte écrit par l'IA qui pourraient être détectés par un logiciel sans affecter la lisibilité du texte. Mais cela devrait inclure la participation des entreprises qui produisent du contenu d’IA, et il est peu probable qu’elles fassent quelque chose qui les désavantagerait par rapport à leurs concurrents.

Cela dit, voici quelques-uns des détecteurs IA les plus utilisés. Pour essayer tous les gratuits, j'ai parcouru le texte de ma propre histoire. Dall-E est-il le prochain Dior ? Comment l'IA essaie de « le faire fonctionner » dans la mode, ainsi que le texte d'une invite générée par ChatGPT : « Veuillez m'écrire un article sur la façon dont l'IA est utilisée dans l'industrie de la mode, en particulier Stable Diffusion, DALL-E 2, et à mi-parcours."

AI Text Classifer (Ouvre dans une nouvelle fenêtre) provient directement de la source : le développeur ChatGPT OpenAI.

Il semble un peu gênant pour ChatGPT de s'évaluer lui-même, mais comme il s'agit d'une IA, cela ne s'en soucie probablement pas. OpenAI est également franc sur les limites de cette solution : elle fonctionne mieux avec un minimum de 1 000 caractères ; il peut étiqueter de manière erronée le texte généré par l’IA et le texte écrit par l’homme ; cela ne fonctionne pas bien sur des textes écrits par des enfants ou qui ne sont pas en anglais ; et quelques ajustements au texte généré par l'IA l'aident à échapper facilement au classificateur.

AI Text Classifier, dont l'utilisation est gratuite, note le texte en fonction de sa probabilité d'être généré par l'IA : très improbable, peu probable ou peu clair. OpenAI souligne que le détecteur est destiné à « favoriser la conversation sur la distinction entre le contenu écrit par l'homme et celui généré par l'IA » plutôt que de fournir une réponse définitive.

J'ai utilisé AI Text Classifer pour évaluer l'intégralité de l'essai écrit par ChatGPT et cela a donné ce résultat : "Le classificateur considère que le texte est probablement généré par l'IA." Pour mon propre texte, l'outil a déterminé ceci : "Le classificateur considère que le texte est très peu probable généré par l'IA."

GPTZero (Ouvre dans une nouvelle fenêtre) brisait les rêves des étudiants quelques jours seulement après que ChatGPT ait fait la une des journaux. Il a été développé par l'un des leurs, Edward Tsai, senior de Princeton (Ouvre dans une nouvelle fenêtre), qui a utilisé les connaissances de sa majeure en sciences informatiques et de sa mineure en journalisme pour analyser le texte à la recherche de « perplexité » (la complexité des idées et du langage) et « rafale » (s'il y a un mélange de phrases longues et courtes plutôt que de phrases de longueur plus uniforme).