Anthropic Glasswing : Claude Mythos découvre 10 000+ failles critiques en un mois — et le vrai problème, c'est le patch

Skynet Watch 🟢 Débutant ⏱️ 14 min de lecture 📅 2026-05-29

Anthropic Glasswing : Claude Mythos découvre 10 000+ failles critiques en un mois — et le vrai problème, c'est le patch

🔎 Quand l'IA trouve tout, mais que personne ne répare

Anthropic vient de publier le premier bilan de Project Glasswing, et les chiffres sont stupéfiants. En un mois, Claude Mythos Preview a aidé 50 organisations partenaires — dont Cloudflare et Mozilla — à découvrir plus de 10 000 vulnérabilités classées high ou critical dans des logiciels critiques.

Le taux de découverte de bugs a été multiplié par 10 par rapport aux méthodes traditionnelles de fuzzing et d'audit manuel. Ça, c'est la partie triomphale.

La partie gênante : sur les milliers de failles remontées aux mainteneurs upstream, seuls 97 ont été corrigés à ce jour. Soit un taux de patching inférieur à 1 %.

Le gap entre découverte et correction n'est pas un nouveau problème. Mais Glasswing le transforme en crise systémique : l'IA放大 la capacité de détection sans que l'écosystème de patching ne suive. On n'a jamais eu autant de vulnérabilités connues et non corrigées.

L'essentiel

Project Glasswing : 50 partenaires, 10 000+ vulnérabilités high/critical trouvées en un mois avec Claude Mythos Preview.
Le taux de découverte a été multiplié par 10 par rapport aux outils classiques (fuzzers, SAST).
Seuls 97 bugs ont été patchés sur les milliers remontés upstream — moins de 1 %.
Le bottleneck n'est plus la détection, c'est la correction, la validation et le déploiement du patch.
L'étude Benchmarking Mythos-Linked Bug Rediscovery valide la fiabilité des découvertes de Mythos.

Outils recommandés

Claude Opus 4.7 (Adaptive)	Analyse de code agentic, audit sécurité	Prix variable (juin 2025, vérifiez sur anthropic.com)	Équipes sécurité needing raisonnement profond
GPT-5.5	Review de code, détection de patterns	Prix variable (juin 2025, vérifiez sur openai.com)	Développeurs intégrant l'audit dans le workflow
DeepSeek V4 Pro (Max)	Analyse statique assistée par LLM	Prix variable (juin 2025, vérifiez sur deepseek.com)	Teams cherchant une alternative coût-efficace
Hostinger	Hébergement sécurisé pour infra de scanning	À partir de 2,99 € (juin 2025, vérifiez sur hostinger.com)	Déploiement d'outils d'audit self-hosted

Project Glasswing : ce que c'est exactement

Glasswing est un programme lancé par Anthropic pour tester Claude Mythos Preview à l'échelle réelle sur des logiciels en production. Pas de benchmarks synthétiques : du vrai code, de vraies dépendances, de vrais utilisateurs.

Le principe est simple. Anthropic fournit un accès à Mythos Preview aux partenaires. Ces derniers l'intègrent dans leurs pipelines de sécurité existantes. Les résultats sont collectés, vérifiés et remontés aux mainteneurs des projets concernés.

L'infrastructure de sandboxing derrière Mythos est documentée dans l'étude Mythos and the Unverified Cage: Z3-Based Pre-Deployment Verification for Frontier-Model Sandbox Infrastructure. Anthropic a développé un système de vérification formelle basé sur Z3 pour s'assurer que le modèle ne peut pas échapper du sandbox pendant l'analyse de code potentiellement malveillant.

C'est un point crucial : on demande littéralement à un LLM de chercher des exploits dans du code. Si le sandbox est défectueux, on crée un outil d'attaque, pas de défense.

Les chiffres du premier mois : 10 000+ et 50 partenaires

Les données publiées par Anthropic dans son update initial sont sans appel.

50 organisations ont participé à cette première phase. Parmi elles, Cloudflare et Mozilla sont les plus visibles, mais le programme inclut aussi des entreprises d'infrastructure cloud, des éditeurs de logiciels open source et des équipes de sécurité internes de grandes entreprises.

Le volume : plus de 10 000 vulnérabilités classées high ou critical selon la sévérité CVSS. Ce n'est pas du bruit de scan. L'étude Benchmarking Mythos-Linked Bug Rediscovery montre que Mythos atteint un taux de re-découverte de bugs connus proche de 94 %, ce qui valide que les 10 000 findings ne sont pas des faux positifs massifs.

Le facteur 10x n'est pas une estimation marketing. C'est la comparaison directe entre les résultats de Mythos et ceux des outils préexistants (AFL++, libFuzzer, SAST commerciaux) sur les mêmes cibles, pendant la même période.

En termes de modèles impliqués, Claude Mythos Preview s'appuie sur la famille Claude Opus. Claude Opus 4.7 (Adaptive), qui score 94.3 sur les benchmarks agentic et 90 en général, en est le moteur principal. Les tâches de raisonnement sur le code bénéficient directement de cette capacité agentic.

Comment Mythos trouve des failles que les outils classiques ratent

La différence fondamentale entre Mythos et un fuzzer traditionnel, c'est la compréhension sémantique du code.

Un fuzzer comme AFL++ génère des inputs aléatoires ou mutés pour faire crasher un programme. Il est aveugle à la logique métier. S'il n'atteint pas un chemin de code particulier, il ne trouvera jamais la faille qui s'y cache.

Mythos, lui, lit le code source. Il comprend les invariants, les assertions, les transitions d'état. Il identifie les endroits où un invariant est supposé tenir mais où rien ne l'applique effectivement. Il génère ensuite des inputs ciblés pour violer précisément cet invariant.

L'étude AI Governance and Accountability: An Analysis of Anthropic's Claude soulève un point intéressant sur la gouvernance de ce processus : quand un LLM trouve une faille, qui est responsable de la divulgation ? Anthropic a opté pour un modèle où le partenaire garde le contrôle total du flux de divulgation. Mythos est un outil, pas un arbitre.

La pipeline typique dans Glasswing ressemble à ça : le partenaire cible un composant → Mythos analyse le code et les dépendances → il génère des PoC (Proof of Concept) dans un sandbox vérifié formellement → les PoC sont validées par l'équipe sécurité du partenaire → les findings sont remontés upstream.

C'est là que le bât blesse.

Le vrai scoop : 97 patches sur 10 000+ findings

The Hacker News rapporte que seuls 97 bugs ont été corrigés à ce stade. Le chiffre est confirmé par Security Boulevard, qui décrit les obstacles au patching exposés par le programme.

Moins de 1 % de taux de correction. C'est le chiffre qui devrait garder les CISO éveillés la nuit.

Pourquoi un tel gap ? Plusieurs facteurs convergent.

Premièrement, le volume. Les mainteneurs open source reçoivent déjà des centaines de rapports par mois. Ajouter 200 findings valides d'un coup sur un seul projet n'est pas un soulagement, c'est une surcharge cognitive.

Deuxièmement, la confiance. Un rapport de vulnérabilité généré par IA n'a pas la même crédibilité qu'un rapport d'un chercheur humain avec un parcours connu. Les mainteneurs veulent valider chaque finding à la main. Avec 10 000 findings, la validation seule prend des mois.

Troisièmement, la complexité des patches. Une faille de type buffer overflow, c'est relativement simple à corriger. Mais Mythos trouve des bugs logiques complexes — des invariants violés dans des machines à états, des conditions de course subtiles, des failles de autorisation dans des graphes de permissions. Corriger ces bugs sans casser la rétrocompatibilité demande un travail d'architecture, pas un quick fix.

L'anatomie du bottleneck de patching

Le problème n'est pas nouveau. L'industrie de la sécurité connaissait déjà le gap entre découverte et correction. Le rapport NSA/CISA sur les vulnérabilités les plus exploitées le répète chaque année : les organisations ne patchent pas assez vite.

Mais Glasswing change d'échelle. On passe d'un robinet qui goutte à un tuyau d'incendie.

La chaîne de patching typique comporte cinq étapes : découverte → validation → correction → review → déploiement. Avant Mythos, le bottleneck était sur la découverte. Maintenant, il s'est déplacé sur les quatre étapes suivantes, et elles ne scalent pas de la même manière.

La validation est linéaire : un humain doit vérifier chaque finding. La correction est linéaire : un développeur doit écrire chaque patch. La review est linéaire : un mainteneur doit lire et approuver chaque PR. Le déploiement est contraint par les cycles de release.

Seule la découverte scale exponentiellement, car c'est la seule étape où le calcul parallélisable fait le travail. Résultat : on crée un embouteillage monstre en aval.

C'est un problème d'ingénierie des flux, pas un problème d'IA. Et il faut l'adresser comme tel.

Les partenaires parlent : Cloudflare, Mozilla et le reste

Cloudflare a été l'un des partenaires les plus actifs du programme. Leur infrastructure traite plus de 20 % du trafic web mondial. Chaque faille dans leur stack est potentiellment catastrophique.

Leurs équipes de sécurité ont intégré Mythos dans leur pipeline d'audit interne. Résultat : des centaines de findings dans des composants internes et des dépendances open source. Mais Cloudflare a aussi les ressources pour traiter un volume élevé de rapports — ce qui n'est pas le cas d'un mainteneur solo d'un package npm avec 2 millions de downloads.

Mozilla, de son côté, a utilisé Mythos sur des composants de Firefox et de leur infrastructure de sync. Les findings incluent des bugs dans le parsing de formats web complexes — exactement le type de code où les fuzzers traditionnels sont déjà bons, mais où Mythos a trouvé des vecteurs d'attaque que les fuzzers n'atteignaient pas.

Le contraste entre ces grands acteurs et les petits mainteneurs est le cœur du problème. Anthropic a conscience de cette asymétrie, mais la résoudre dépasse le cadre d'un programme de recherche.

La gouvernance de Mythos : un modèle sous tension

L'étude AI Governance and Accountability: An Analysis of Anthropic's Claude analyse précisément la tension dans laquelle se trouve Anthropic avec ce type d'outil.

D'un côté, rendre Mythos plus agressif augmente le nombre de découvertes. De l'autre, chaque false positive génère du travail inutile pour les mainteneurs, et chaque true positive non patchée crée une responsabilité — ou au moins un risque réputationnel.

Anthropic a choisi un équilibre conservateur : Mythos produit un taux de faux positifs bas (validé par le benchmark de re-découverte), mais le modèle ne prend aucune décision de divulgation. C'est toujours le partenaire humain qui décide quand, comment et à qui remonter le bug.

Ce modèle de gouvernance est raisonnable, mais il ne résout pas le problème du volume. La responsabilité morale de créer 10 000 findings non corrigés reste floue. Anthropic fournit l'outil, le partenaire fait le signalement, le mainteneur ne patche pas. Qui est en faute ? Personne, et tout le monde.

Ce que cela signifie pour les modèles d'audit assistés par IA

Le benchmark Benchmarking Mythos-Linked Bug Rediscovery établit une méthodologie importante : pour évaluer un outil de découverte de vulnérabilités par IA, il ne suffit pas de mesurer le nombre de findings. Il faut mesurer le taux de re-découverte sur des bugs connus (pour calibrer la sensibilité) et le taux de faux positifs (pour calibrer la spécificité).

Mythos performe extrêmement bien sur ces deux métriques. Ce qui signifie que les 10 000 findings sont probablement majoritairement de vrais bugs. Le problème n'est pas la qualité des findings, c'est le throughput du pipeline de correction.

Pour les équipes qui envisagent d'utiliser des LLM pour l'audit de code — que ce soit avec Claude Opus 4.7 ou GPT-5.5 — la leçon de Glasswing est claire : ne déployez un outil de découverte augmentée que si vous avez prévu un pipeline de correction augmenté en face. Sinon, vous transformez un problème caché en problème visible mais toujours non résolu.

Dans le contexte du comparatif des meilleurs LLM pour coder, Claude Opus 4.7 (Adaptive) se distingue précisément sur ce type de tâche : son score agentic de 94.3 reflète sa capacité à maintenir un raisonnement cohérent sur de longues traces d'analyse de code, ce qui est essentiel pour un audit de sécurité.

L'infrastructure de sandbox : pourquoi c'est non négociable

L'étude Mythos and the Unverified Cage détaille l'architecture de sécurité qui entoure Mythos. C'est un point souvent négligé dans la couverture médiatique, mais il est central.

Quand vous demandez à un LLM d'analyser du code à la recherche de vulnérabilités, vous lui donnez effectivement la capacité de comprendre et de générer des exploits. Si le sandbox qui isole le modèle est défectueux, le modèle peut utiliser cette compréhension pour s'échapper.

Anthropic utilise un vérifieur formel basé sur Z3 (un SMT solver) pour prouver mathématiquement que certaines propriétés de sécurité du sandbox tiennent. Ce n'est pas du testing, c'est de la preuve formelle. C'est coûteux en calcul, mais nécessaire quand le modèle analysé est lui-même un modèle de frontière.

Cette approche est cohérente avec la philosophie de sécurité d'Anthropic, qui a toujours privilégié la vérification formelle sur le testing empirique pour les questions de sécurité critique. Mais elle soulève aussi la question : cette infrastructure de sandbox est-elle accessible aux partenaires de Glasswing, ou reste-t-elle interne à Anthropic ?

Anthropic et la dynamique de puissance computationnelle

Le contexte plus large de Glasswing s'inscrit dans la stratégie computationnelle d'Anthropic. Rappelons qu'Anthropic a signé avec SpaceX pour Colossus 1 : 220 000 GPUs et 300 MW pour Claude. Ce niveau d'investissement computationnel n'est pas seulement destiné à l'entraînement de modèles. Il alimente aussi des infrastructures comme le sandboxing formel de Mythos et les capacités agentic qui rendent Glasswing possible.

Parallèlement, le lancement de Claude Code Agent View : le dashboard qui tue le terminal split-screen montre qu'Anthropic pense l'expérience développeur de bout en bout. L'audit de sécurité par Mythos n'est pas un outil isolé — il s'intègre dans un écosystème où l'agent Claude travaille de manière visible et traçable.

Et la recherche sur Anthropic Dreaming : les agents Claude apprennent de leurs rêves entre les sessions suggère que les futures versions de Mythos pourraient améliorer leurs capacités de détection entre les sessions d'analyse, sans réentraînement complet. Un agent qui "rêve" des patterns de vulnérabilités entre deux scans pourrait théoriquement affiner sa compréhension des classes de bugs.

Comparatif : Mythos vs les approches classiques

Approche	Taux de découverte (relatif)	Taux de faux positifs	Coût par scan	Scalabilité
Fuzzing (AFL++, libFuzzer)	1x (baseline)	Très bas	Bas (CPU)	Haute (parallélisable)
SAST commercial	0.3-0.5x	Élevé (30-70 %)	Moyen	Haute
Audit manuel	0.8-1.2x	Quasi nul	Très élevé	Très basse
Claude Mythos Preview	10x	Bas (< 6 %)	Élevé (GPU)	Moyenne (limitée par infra)

Le tableau montre clairement le trade-off. Mythos écrase les autres approches sur le taux de découverte, avec un taux de faux positifs maîtrisé. Mais le coût par scan est significativement plus élevé, et la scalabilité est contrainte par la disponibilité GPU — d'où l'importance stratégique d'investissements comme Colossus 1.

❌ Erreurs courantes

Erreur 1 : Confondre volume de findings avec niveau de sécurité

Trouver 10 000 failles ne rend pas un système plus sûr. Seules les failles corrigées améliorent la sécurité. Présenter le chiffre brut comme une victoire est trompeur, et Anthropic ne le fait d'ailleurs pas — ils soulignent eux-mêmes le problème de patching.

Erreur 2 : Déployer Mythos (ou tout LLM d'audit) sans pipeline de correction en face

Si votre équipe de sécurité peut traiter 50 findings par mois et que l'outil en génère 500, vous n'avez pas amélioré votre sécurité. Vous avez créé une backlog anxiogène. Dimensionnez le débit de découverte au débit de correction.

Erreur 3 : Négliger le sandbox

Lancer un LLM sur du code non sandboxé pour chercher des vulnérabilités, c'est donner un couteau à quelqu'un dans une pièce remplie de gaz. L'étude sur le Z3-Based Verification montre que même Anthropic ne fait pas de compromis là-dessus. Vous non plus ne devriez pas.

Erreur 4 : Remonter les findings upstream en vrac

Un mainteneur qui reçoit un rapport avec 200 vulnérabilités d'un coup va le classer comme spam. Priorisez, triez par exploitabilité, et remontez en fonction de la capacité d'absorption du projet cible.

❓ Questions fréquentes

Claude Mythos est-il disponible au public ?

Non. Pour l'instant, Mythos Preview est accessible uniquement dans le cadre de Project Glasswing, sur invitation d'Anthropic. Il n'existe pas d'API publique ni de version self-hosted.

Les 10 000 failles concernent quels types de logiciels ?

Un mix de bibliothèques open source critiques (parsing, crypto, réseau), de composants d'infrastructure cloud et de code propriétaire des partenaires. Les catégories CVSS les plus représentées sont les injections, les corruptions de mémoire et les failles d'autorisation.

Un taux de patching de 1 % est-il vraiment surprenant ?

Pas si on regarde les données historiques. Le temps moyen de patch d'une vulnérabilité CVE est de 60 à 120 jours selon les études de l'industrie. Avec 10 000 findings en un mois, même un temps de patch de 30 jours donnerait un taux de correction très bas au jour J. Le problème est le volume, pas la lenteur individuelle.

Mythos remplace-t-il les fuzzers ?

Non, c'est complémentaire. Les fuzzers restent excellents pour trouver des crashes dans des parsers et des formats binaires, à très faible coût. Mythos excelle sur la logique métier, les machines à états et les graphes de permissions. Les deux ensemble couvrent plus de terrain.

Quel modèle Claude est utilisé derrière Mythos ?

Claude Mythos Preview est basé sur la famille Claude Opus, avec des adaptations spécifiques pour le raisonnement sur la sécurité. Claude Opus 4.7 (Adaptive), le modèle agentic le plus performant d'Anthropic (94.3 au benchmark agentic), en est la base probable.

✅ Conclusion

Glasswing prouve que Claude Mythos peut multiplier par 10 la découverte de vulnérabilités — mais il prouve surtout que le pipeline de patching de l'industrie logicielle n'est pas dimensionné pour cette réalité. 10 000 findings et 97 patches : le bottleneck a changé de camp, et il faut le traiter avec la même urgence qu'on a mise à améliorer la détection. La prochaine bataille de la sécurité logicielle ne se gagnera pas avec de meilleurs scanneurs, mais avec de meilleurs processus de correction.

#anthropic-glasswing #claude-mythos #failles-critiques #cybersecurite #vulnerabilites #patch

📚 Articles liés

Skynet Watch 🟢 Débutant 14 min

OpenAI propose de céder 5% de ses parts au gouvernement américain : les 42,6 milliards de dollars qui redéfinissent la politique IA

OpenAI propose de céder 5% de ses parts au gouvernement américain, soit 42,6 milliards de dollars. Découvrez comment ce deal redéfinit la politique IA.

2026-07-14 15:03

Skynet Watch 🟢 Débutant 14 min

46% des tokens IA des entreprises américaines partent vers des modèles chinois — l'enquête CNBC qui change tout

Selon une enquête CNBC, 46% des tokens IA des entreprises américaines partent vers des modèles chinois. Découvrez ce bouleversement du marché.

2026-07-09 15:07

Skynet Watch 🟢 Débutant 18 min

ONU : le premier Dialogue mondial sur la gouvernance de l'IA s'ouvre à Genève

Découvrez le premier Dialogue mondial sur la gouvernance de l'IA à Genève, un événement historique de l'ONU réunissant États et géants de la tech.

2026-07-06 14:13

📑 Table des matières