Anthropic dénonce l’exploitation de Claude par trois laboratoires chinois pour entraîner leurs IA

Entre accusations croisées et mesures de sécurité renforcées, Anthropic lutte pour sécuriser son modèle d’IA générative.

Anthropic
Image d'illustration. Anthropic — Anthropic / PR-ADN

Tl;dr

  • Anthropic accuse trois sociétés chinoises d’avoir utilisé des échanges massifs avec Claude pour améliorer leurs propres modèles via la distillation d’IA.
  • Plus de 16 millions d’interactions suspectes auraient été recensées, révélant une stratégie organisée pour contourner les protections du chatbot.
  • En réponse, Anthropic renforce ses mesures de sécurité et de détection, soulignant les tensions persistantes et les enjeux éthiques dans l’IA générative.

Des soupçons grandissants autour de la distillation d’IA

Il flotte comme un parfum de méfiance dans l’écosystème de l’intelligence artificielle. L’entreprise américaine Anthropic, à l’origine du robot conversationnel Claude, a jeté un pavé dans la mare en dénonçant les pratiques de trois sociétés concurrentes. Selon elle, DeepSeek, Moonshot et MiniMax — toutes basées en Chine — auraient orchestré des campagnes massives visant à « extraire illicitement les capacités de Claude pour améliorer leurs propres modèles ».

La méthode en question : la distillation d’IA

Dans le jargon technique, on parle ici de distillation d’IA. Concrètement, il s’agit pour un modèle moins performant de s’entraîner sur les réponses produites par un modèle plus avancé. Si cette méthode n’est pas systématiquement problématique, elle franchit une ligne rouge lorsqu’elle devient un outil massif destiné à copier, voire détourner, l’innovation technologique.

C’est justement ce que reproche Anthropic à ses concurrents. Les chiffres avancés par la société impressionnent : plus de « 16 millions d’échanges avec Claude via environ 24.000 comptes frauduleux » auraient été recensés. Derrière ces interactions suspectes se cacherait une stratégie organisée pour contourner les garde-fous intégrés au chatbot.

L’enquête technique et les précédents dans le secteur

Pour établir ses accusations, Anthropic affirme avoir rassemblé des preuves solides grâce à une corrélation des adresses IP, l’analyse des métadonnées et certains indicateurs d’infrastructure. La société précise avoir recoupé ses observations avec celles d’autres acteurs du secteur constatant des comportements similaires.

Loin d’être isolé, ce phénomène avait déjà été pointé du doigt par OpenAI. L’an dernier, ce géant américain affirmait lui aussi avoir banni plusieurs comptes soupçonnés de distillation sur ses propres modèles.

Nouvelles mesures et tensions persistantes

Face à cette escalade, la réponse ne s’est pas fait attendre : Anthropic annonce vouloir renforcer la protection et la détection des attaques par distillation sur sa plateforme. Une mesure jugée nécessaire alors que le secteur reste sous tension, entre accusations croisées et actions en justice. D’ailleurs, ironie du sort, l’entreprise américaine est elle-même ciblée par une plainte émanant d’éditeurs musicaux, l’accusant cette fois-ci d’avoir utilisé « des copies illégales de chansons pour entraîner Claude ».

Les défis liés à la sécurisation des modèles d’IA générative, tant sur le plan éthique que technologique, semblent donc loin d’être résolus.

Jordan Servan

Spécialiste Tech

Rédacteur sur Begeek.fr depuis 2014, passionné par les jeux vidéo, les séries TV et le cinéma.

X LinkedIn Tous ses articles →
Sujets
Anthropic IA

Lisez Begeek en priorité sur Google

Ajoutez-nous à vos sources préférées : nos articles remonteront plus haut dans votre actualité.

Ajouter à mes sources

À découvrir

La suite, sélectionnée pour vous.