Reddit poursuit pour bloquer le grattage des données par l’IA
Reddit a décidé de poursuivre en justice quatre entreprises accusées de grattage de données non autorisé pour alimenter des projets d’intelligence artificielle.
D’après ce qui a été rapporté par New York Timesla plateforme a déposé une plainte auprès du tribunal de district américain pour arrêter la collecte d’informations via la recherche Google, en contournant le paiement de l’API Reddit.
Les entreprises impliquées dans le procès
Dans le collimateur se trouvent SerpApi, la start-up lituanienne Oxylabs, la société russe AWMProxy et l’américain Perplexity, qui développe un moteur de recherche d’IA.
Reddit accuse ces sociétés d’avoir vendu ou utilisé les données des publications et conversations des utilisateurs pour alimenter les outils d’intelligence artificielle de géants tels qu’OpenAI et Meta.
L’objectif de Reddit : protection et précédent juridique
Reddit demande une injonction permanente et des dommages-intérêts économiques, mais plus important encore, il souhaite établir un précédent juridique clair sur la protection des données générées par les utilisateurs. Avec la montée en puissance des projets d’IA recherchant des informations de qualité pour la formation des modèles, Reddit vise à garantir que son contenu n’est utilisé que de manière autorisée et rémunérée.
Reddit et la valeur économique des données
La plateforme a augmenté les prix de ses API en 2023, justement pour mieux monétiser l’énorme quantité d’informations produites chaque jour.
Au deuxième trimestre 2025, Reddit a enregistré une croissance de +24 % d’une année sur l’autre dans la catégorie « Autres revenus », atteignant 35 millions de dollars grâce à des accords de licence avec des sociétés d’IA telles que Google et OpenAI.
LIRE AUSSI : ChatGPT Atlas est le nouveau navigateur OpenAI qui transforme la navigation web en dialogue
Le scraping, une menace pour les entreprises
Reddit affirme que les fournisseurs impliqués ont contourné les restrictions en collectant du contenu non pas directement à partir de la plateforme, mais à partir des résultats de Google.
Cette pratique, selon l’entreprise, met en péril la valeur de ses données et l’exclusivité des accords commerciaux, décourageant d’autres entreprises de payer pour un accès légitime à l’information.
Une bataille juridique qui implique également d’autres réseaux sociaux
Il ne s’agit pas d’un cas isolé : LinkedIn et Meta ont également engagé des poursuites judiciaires contre ceux qui extraient des données sans autorisation, tandis que X a menacé de poursuites similaires. La ruée des projets d’IA vers de nouveaux ensembles de données rend inévitable un conflit juridique entre les plateformes sociales et ceux qui cherchent à exploiter leur contenu.
LIRE AUSSI : Facebook veut utiliser les photos de votre smartphone pour entraîner l’IA
Reddit et l’avenir de la protection des données
Le procès de Reddit contre les sociétés d’IA pourrait devenir une affaire historique pour l’ensemble du secteur. Avec des milliards de dollars en jeu, la capacité des plateformes à contrôler et monétiser leurs données devient l’un des enjeux centraux de l’avenir numérique.
Reddit veut démontrer que les connaissances produites par les utilisateurs ont de la valeur et que cette valeur doit être respectée.
