Perplexité accusée de grattage illégal

Le fournisseur d’infrastructures Internet CloudFlare a publiquement dénoncé la perplexité à la perplexité illégale de gratte, accusant la startup d’avoir contourné les restrictions explicites de nombreux sites Web.

Selon la recherche publiée le 4 août 2025, l’intelligence artificielle de perplexité aurait recueilli du contenu de dizaines de milliers de domaines, ignorant des règles fondamentales telles que le fichier robots.txt.

Violations du fichier masqué robots.txt et d’agent utilisateur

L’un des points les plus graves mis en évidence par CloudFlare concerne les violations des fichiers Robots.txt, la norme qui permet aux sites de signaler quel contenu peut être indexé ou non.

La perplexité est accusée d’avoir ignoré ces indications, de modifier leur vieillissement pour cacher l’identité de ses robots et de se présenter comme des navigateurs légitimes que Google Chrome sur MacOS.

Lisez aussi: Google Lancia Gemini 2.5 Deep Think, le modèle AI qui pense en parallèle

Cloudflare vs perplexité: les accusations en détail

Selon CloudFlare, la perplexité aurait utilisé des réseaux ASN et des techniques d’empreinte digitale pour contourner les contrôles. L’infrastructure détectée, combinée à des demandes massives, suggère une tentative consciente d’échapper aux blocs des bots.

L’activité a été enregistrée par des millions de demandes par jour, bien que les sites aient explicitement bloqué la perplexité dans le fichier robots.txt.

La perplexité modifie l’agent utilisateur pour contourner les blocs

L’un des éléments centraux de la plainte concerne le changement d’agent utilisateur par perplexité. Le Crawler s’est présenté sous différentes identités, y compris les navigateurs génériques, simulant l’accès humain à partir de bureaux communs.

Et ce comportement fait partie des pratiques les plus contestées dans le débat sur l’IA et le grattage: outils automatisés qui plagian le contenu des sites non autorisés, violant les règles techniques et éthiques.

Lire aussi: GPT-5 arrive en août: tout ce que nous savons jusqu’à présent

Bot à non autorisé et protection du contenu Web

La controverse avec perplexité met en évidence le problème croissant des robots à ceux non autorisés qui violent la protection du contenu Web.

De plus en plus de sites tentent de se défendre contre l’intelligence artificielle qui retirent le contenu sans autorisation, les exploitant pour former des modèles génératifs. La technologie, cependant, surmonte les défenses: le respect de la confidentialité en ligne et le droit d’auteur numérique est désormais plus fragile que jamais.

Cloudflare contre les grabyers AI: nouveaux outils de défense

Cloudflare ne s’est pas limitée à la plainte. La société a annoncé qu’elle avait supprimé la perplexité de la liste des robots vérifiés et introduit de nouvelles techniques pour bloquer le grattage.

Parmi les initiatives les plus récentes: un marché qui permet aux éditeurs de payer l’IA pour accéder au contenu, et un outil gratuit pour bloquer les robots au bot non transparent.

Ai Che Plagia Contenu: Le précédent avec Wired and Disrupt 2024

Ce n’est pas la première fois que la perplexité est accusée de grattage non autorisé. Déjà en 2024, testé comme câblé avait soulevé des doutes sur le contenu copié sans mention.

À cette occasion, lors d’une entrevue publique avec la perturbation 2024, le PDG de Perplexity ne clarifie pas clairement le concept de plagiat, suggérant une zone grise entre l’utilisation légale et la violation du droit d’auteur.

IA et respect pour la confidentialité en ligne: le débat reste ouvert

Le cas de perplexité relance le thème de l’intelligence artificielle et du respect de la confidentialité en ligne.

Jusqu’où peut-on aller pour améliorer la qualité de ses réponses? Qui protège le contenu original produit par l’éditeur, les blogueurs et les journalistes?

Le défi entre l’innovation et la réglementation vient de commencer, mais les enjeux sont l’équilibre même du Web.