NAMUR – 14-10-2024 / Les détecteurs de contenu IA sont-ils fiables ?
Les détecteurs de contenu IA sont loin d’être parfaits. Avec l’essor des outils d’intelligence artificielle pour la génération de texte, ces détecteurs se sont imposés pour tenter de distinguer les créations humaines de celles produites par un robot. Il s’avère qu’ils sont souvent imprécis. Et qu’ils peuvent même induire les robots SEO en erreur. Comme le remarque Saâd Kettani, directeur associé de l’agence K.ractère, « la technologie n’a pas encore atteint un niveau où elle peut garantir une distinction fiable ». L »essentiel, désormais, est de savoir pourquoi.
Comment fonctionnent les détecteurs de contenu IA ?
Les détecteurs de contenu IA reposent sur des modèles similaires à ceux des générateurs de texte. Ils analysent la structure des phrases, le choix des mots et les schémas syntaxiques. Une suite de phrases dotées d’une longueur homogène peut ainsi être perçue comme un indice de contenu automatisé. Pourquoi ? Parce que les auteurs humains varient les rythmes pour garder le lecteur engagé. Mais ces critères restent imparfaits et trop rigides.
Une anecdote vécue par Saâd Kettani illustre ce cas de figure : lors d’une formation interne, un membre de l’équipe a testé un article qu’il avait écrit lui-même. L’outil de détection a été incapable de le classifier comme étant rédigé par un humain. « Ce constat m’a fait sourire, mais aussi réfléchir », souligne-t-il. Cette situation montre bien les limites actuelles de ces détecteurs.
Les limites des détecteurs de contenu IA
Une étude a récemment mis à l’épreuve les trois des détecteurs IA les plus courants — ZeroGPT, Copyleaks et TraceGPT.
Les résultats obtenus ont été loin d’être convaincants : ZeroGPT et TraceGPT ont obtenu des taux de précision inférieurs à 30 %.
« Nous avons été surpris par cette marge d’erreur , note encore Saâd Kettani. J’estime que ces erreurs ne sont pas anodines. Elles peuvent mener à rejeter des contenus valides ou, à l’inverse, à valider des contenus générés.»
Pourquoi ces détecteurs se trompent-ils assez souvent ? Voici trois raisons principales :
-
- Dépendance aux schémas prédéfinis : les outils détectent des motifs prédéterminés. Or, l’écriture humaine est bien plus nuancée et contextuelle, ce qui rend les schémas trop généralistes.
-
- Personnalisation : les touches personnelles, telles que les anecdotes ou l’utilisation de pronoms personnels, sont vues comme des signes d’une rédaction humaine, mais l’IA peut les reproduire également.
-
- Prompts sophistiqués : les IA modernes, lorsqu’elles sont bien guidées, sont capables de produire un contenu qui imite très bien la créativité humaine.
Alternatives aux détecteurs de contenu IA : miser sur l’authenticité
Pour beaucoup, l’enjeu reste de s’assurer que leur contenu paraisse authentiquement humain. Plutôt que de se fier à des détecteurs, il est préférable de porter son attention sur certains éléments du texte :
-
- Structure claire et informative : les auteurs humains utilisent souvent une structure logique, comme la méthode « Quoi-Pourquoi-Comment ». L’IA a tendance à présenter des explications superficielles.
-
- Tonalité personnelle : un texte qui exprime des opinions, parfois de manière subjective, est souvent rédaction humaine. Comme le dit Saâd Kettani : « N’ayez pas peur de dire ce que vous pensez. Les IA ne sont pas encore capables d’avoir des avis tranchés ».
-
- Nuance et vocabulaire : un texte nuancé, qui évite les clichés et varie le vocabulaire, est plus susceptible de résonner avec les lecteurs.
La vraie priorité : la qualité du contenu
Plutôt que de chercher à maximiser un score ou à tromper des outils, la vraie priorité devrait être de se concentrer sur la qualité du contenu. Un texte bien rédigé, qui répond aux attentes de l’audience et qui reflète l’authenticité de l’auteur, suscite naturellement de l’intérêt. En améliorant les compétences en écriture et en prenant le temps de soigner chaque paragraphe, on s’assure que le contenu résonne avec le lecteur, indépendamment des algorithmes.
En conclusion, la question ne devrait pas être de savoir si un contenu est généré par une IA ou non, mais plutôt s’il est pertinent, engageant et apporte de la valeur. « Le vrai défi était, est et restera de toucher les gens », conclut Saâd Kettani.