Anthropic pris entre régulation et usage défensif de l’IA

Image d'illustration. AnthropicAnthropic / PR-ADN
Le blocage américain sur Fable et Mythos d’Anthropic déclenche une fronde rare. Les pros de la cybersécurité y voient un très mauvais signal.
En bref
- Des experts en cybersécurité dénoncent une décision qui limite leurs outils essentiels, les empêchant d’utiliser des IA utiles pour détecter et corriger des failles de sécurité dans les logiciels.
- Les États-Unis ont ordonné à Anthropic de restreindre certains modèles d’IA pour des raisons de sécurité nationale, sans explication détaillée, ce qui a conduit à leur suspension mondiale et à des restrictions fortes sur leur usage en cybersécurité.
- Le débat dépasse Anthropic et oppose régulation et efficacité des défenseurs, avec des critiques sur le manque de transparence et des appels à des règles plus claires et équilibrées pour encadrer ces modèles.
Le vrai problème, il est là. Avec l’ordre américain contre Fable et Mythos, ce ne sont pas seulement des modèles qui disparaissent, ce sont aussi des outils que les équipes de cybersécurité défensive utilisaient pour trouver des failles, corriger du code et sécuriser des produits.
Une lettre ouverte signée par 76 experts demande donc à l’administration américaine de lever cette mesure. Parmi les signataires, on retrouve du très lourd, comme Alex Stamos, Casey Ellis, Jon Callas, Paul Vixie, Dino Dai Zovi, Katie Moussouris ou encore Rachel Tobac. Leur message, en gros, est simple, priver les défenseurs des meilleurs modèles alors que les adversaires progressent vite, c’est dangereux.
Les défenseurs se retrouvent les mains liées
Dans la lettre, le collectif explique que la décision retire aux professionnels les capacités les plus efficaces pour repérer des vulnérabilités et rendre logiciels et services plus sûrs. Et ce point-là pèse lourd, parce qu’on ne parle pas d’un gadget de labo mais d’usages très concrets côté défense.
Le ton est d’ailleurs inhabituellement frontal. Ces experts ne contestent pas l’idée de réguler, ils contestent une interdiction prise sans raison détaillée publiquement. Résultat, ceux qui bossent à colmater les brèches perdent un levier précieux.
Pourquoi Washington a frappé si vite ?
Le gouvernement américain a récemment ordonné à Anthropic de limiter l’exportation de Fable et Mythos pour des motifs de sécurité nationale. D’après l’entreprise, aucune explication précise n’a été fournie. En réaction, Anthropic a suspendu l’accès aux deux modèles pour tous les utilisateurs dans le monde.
Le dossier est sensible depuis avril. À ce moment-là, Mythos arrivait en preview, avec un accès très verrouillé, parce qu’Anthropic jugeait le modèle assez fort pour découvrir des vulnérabilités de manière risquée. En pratique, environ 50 entreprises y avaient d’abord accès, puis autour de 150 organisations dans 15 pays.
Et la semaine dernière, Fable, version publique de Mythos, a débarqué avec des garde-fous tellement serrés que pas mal de spécialistes ont constaté qu’à peu près toute requête liée à la cybersécurité se faisait bloquer. Pas idéal, clairement.
Le papier d’Amazon qui met le feu
Selon Anthropic, l’ordre de la Maison-Blanche pourrait reposer sur un signalement affirmant qu’il existait une méthode pour contourner les protections de Fable et retrouver des capacités proches de Mythos. Autrement dit, un possible jailbreak.
Sauf que Katie Moussouris, qui dit avoir lu un papier non public de chercheurs d’Amazon, affirme que ce n’était pas un vrai contournement. Dans son billet, elle explique que les chercheurs ont demandé au modèle de corriger du code open source contenant des failles publiques et d’autres vulnérabilités volontairement ajoutées, après un premier refus d’examiner le code sous l’angle sécurité.
Elle résume le fond du problème ainsi : « Les défenseurs doivent pouvoir demander à une IA de corriger les bugs d’un fichier, d’expliquer pourquoi la correction compte, et d’écrire des tests qui confirment que le patch fonctionne ». Bref, pour elle, on parle du cœur même du boulot défensif, pas d’un piratage des garde-fous.
Un débat qui dépasse Anthropic
La lettre va plus loin. Les signataires estiment que la méthode décrite pourrait aussi être reproduite sur GPT-5.5 d’OpenAI, sur Claude Opus 4.8 et Sonnet d’Anthropic, et même sur des modèles chinois comme Kimi 2.7.
Leur demande ne se limite donc pas à sauver Fable et Mythos. Ils réclament des règles transparentes, appliquées équitablement, construites via un processus démocratique, et limitées au strict nécessaire pour protéger le public. Sur un sujet pareil, c’est sans doute la seule ligne tenable.