Claude Mythos : la fuite qui révèle un saut chez Anthropic

Des documents internes d’Anthropic, diffusés sur des forums spécialisés fin mars 2026, révèlent l’existence de Claude Mythos, un modèle de nouvelle génération aux capacités supposément supérieures à tous les modèles actuels. Le leak suggère des avancées majeures en raisonnement long, en utilisation autonome d’outils et en fiabilité factuelle, positionnant Anthropic comme un concurrent direct d’OpenAI et Google DeepMind sur le segment des modèles frontier.

Table of Contents

Ce que révèlent les documents fuités

Les documents, dont l’authenticité n’a pas été confirmée par Anthropic, proviennent d’un repository interne accessible à un cercle restreint d’employés. Ils décrivent un modèle portant le nom de code « Mythos » dans la feuille de route produit du premier semestre 2026. Selon ces fuites relayées par The Information, Claude Mythos serait entraîné sur un cluster de plus de 100 000 GPU H100, un investissement matériel estimé à 2 milliards de dollars.

Le document le plus commenté est un benchmark interne comparant Mythos aux versions actuelles de GPT-5.4, Gemini 2.5 Pro et Claude Opus 4. Sur les tâches de raisonnement multi-étapes (MATH-500, GPQA Diamond), Mythos afficherait un score supérieur de 8 à 15 points par rapport au meilleur modèle concurrent. Sur les tâches de codage (SWE-bench Verified), le modèle atteindrait un taux de résolution de 72 %, contre 55-60 % pour les meilleurs modèles actuels.

Les capacités annoncées

Trois capacités distinguent Mythos de la génération actuelle de modèles. La première est le raisonnement long (extended thinking) poussé à l’extrême : le modèle pourrait maintenir une chaîne de raisonnement cohérente sur plusieurs dizaines de minutes, en décomposant des problèmes complexes en sous-tâches et en vérifiant ses propres résultats intermédiaires. Cette capacité dépasse significativement le chain-of-thought actuel, qui perd en cohérence au-delà de quelques centaines de tokens de raisonnement.

La deuxième innovation concerne l’utilisation autonome d’outils (agentic tool use). Mythos serait capable de planifier et d’exécuter des séquences complexes d’actions — recherche web, exécution de code, manipulation de fichiers, appels API — sans intervention humaine entre les étapes. Le modèle intégrerait un mécanisme de vérification automatique de ses propres actions, réduisant le taux d’erreur dans les workflows multi-étapes de 40 % par rapport aux systèmes agents actuels.

La troisième avancée porte sur la fiabilité factuelle. Selon les documents, Anthropic aurait développé une technique appelée « Constitutional Grounding » qui ancre les réponses du modèle dans des sources vérifiables, réduisant les hallucinations de 60 % sur les benchmarks factuels. Le modèle signalerait proactivement son niveau de certitude et citerait ses sources avec une granularité inédite.

La réaction d’Anthropic et du secteur

Anthropic a publié un communiqué laconique affirmant que l’entreprise ne commente pas les fuites et rappelant que des documents internes sortis de leur contexte peuvent être trompeurs. Dario Amodei, CEO d’Anthropic, a toutefois déclaré lors d’une interview sur CNBC que l’entreprise prévoyait des annonces importantes au deuxième trimestre 2026, sans préciser leur nature.

La communauté des chercheurs en IA a accueilli les fuites avec un mélange d’excitation et de scepticisme. Plusieurs experts soulignent que les benchmarks internes sont souvent optimistes et que les performances réelles en conditions d’utilisation peuvent différer significativement. D’autres notent que les capacités décrites — raisonnement long, outil autonome, fiabilité améliorée — correspondent aux axes de recherche publiquement annoncés par Anthropic depuis 2024.

Ce que cela implique pour la course aux modèles

Si les benchmarks fuités se confirment, Mythos représenterait le plus grand saut de performance entre deux générations de modèles depuis GPT-4. Anthropic, longtemps perçu comme un outsider face à OpenAI et Google, se positionnerait en leader technique sur le segment le plus exigeant du marché. L’entreprise, valorisée à 61 milliards de dollars après sa levée de fonds de janvier 2026, aurait les moyens de ses ambitions.

La temporalité est stratégique. OpenAI prépare le lancement de GPT-6 pour le second semestre 2026, et Google DeepMind travaille sur Gemini 3.0. Si Anthropic annonce Mythos avant ces sorties, l’entreprise pourrait capturer une part significative du marché enterprise, où les performances en raisonnement et en fiabilité sont les critères déterminants. Amazon, principal investisseur d’Anthropic avec 8 milliards de dollars injectés, bénéficierait d’un avantage compétitif décisif pour AWS Bedrock.

Les questions de sécurité soulevées

Anthropic, fondé par d’anciens cadres d’OpenAI préoccupés par la sécurité de l’IA, a toujours mis en avant son approche « responsible scaling ». Les documents fuités mentionnent un programme de red-teaming interne de six mois pour Mythos, impliquant plus de 200 testeurs et des collaborations avec des institutions académiques. Le modèle serait soumis à la Responsible Scaling Policy (RSP) d’Anthropic, qui conditionne le déploiement à l’évaluation des risques à chaque seuil de capacité.

La fuite elle-même pose des questions de sécurité opérationnelle. La diffusion de benchmarks internes et de détails architecturaux, même partiels, donne aux concurrents des indications précieuses sur les orientations de recherche d’Anthropic. Plusieurs observateurs du secteur notent que ce type de fuite tend à se multiplier à mesure que les entreprises d’IA grandissent et que les enjeux financiers augmentent.

FAQ

Quand Claude Mythos sera-t-il disponible ?

Aucune date officielle n’a été communiquée. Les documents fuités suggèrent un lancement au deuxième trimestre 2026, mais ce calendrier pourrait évoluer en fonction des résultats de sécurité et des tests de performance à grande échelle.

Les benchmarks fuités sont-ils fiables ?

Les benchmarks internes doivent être interprétés avec prudence. Ils sont généralement réalisés dans des conditions optimales qui ne reflètent pas toujours l’usage réel. Seuls des tests indépendants après le lancement permettront de vérifier les performances annoncées.

Mythos remplacera-t-il Claude Opus ?

Selon les documents, Mythos se positionnerait au-dessus de la gamme actuelle (Haiku, Sonnet, Opus). Il pourrait coexister avec les modèles existants, chaque tier répondant à des besoins différents en termes de coût, de latence et de capacités.

Ce que révèlent les documents fuités

Les capacités annoncées

La réaction d’Anthropic et du secteur

Ce que cela implique pour la course aux modèles

Les questions de sécurité soulevées

FAQ

Quand Claude Mythos sera-t-il disponible ?

Les benchmarks fuités sont-ils fiables ?

Mythos remplacera-t-il Claude Opus ?

Hugo Brenner

Articles connexes

NVIDIA DLSS 5 et le Neural Rendering : prouesse technique ou trahison artistique ?

Apple et Google officialisent leur alliance : Siri 2.0 sera propulsé par Gemini

AMI Labs de Yann LeCun lève 1 milliard de dollars pour construire les « world models »

Recevez l'actu IA chaque matin