MiniMax M2.5 : le modèle chinois qui rivalise avec Claude à un vingtième du coût

Table of Contents

Points clés

MiniMax M2.5 est un modèle Mixture-of-Experts de 230 milliards de paramètres, dont seulement 10 milliards sont activés par requête
Sur le benchmark SWE-Bench, il atteint 80,2 % contre 80,8 % pour Claude Opus 4.6 — quasi-égalité
Sur Multi-SWE-Bench (tâches multi-fichiers), M2.5 dépasse Opus avec 51,3 % contre 50,3 %
Le coût par million de tokens en sortie s’élève à 1,20 dollar, contre 25 dollars pour Opus — soit vingt fois moins
Temps d’exécution moyen : 22,8 minutes contre 31,3 minutes pour Opus, un gain de 37 %

La startup shanghaienne MiniMax vient de publier M2.5, un modèle de langage qui égale Claude Opus 4.6 sur les benchmarks de programmation tout en coûtant vingt fois moins cher. Ce rapport qualité-prix inédit relance le débat sur la viabilité économique des modèles premium occidentaux face aux challengers chinois.

Une architecture pensée pour l’efficacité

MiniMax M2.5 repose sur une architecture Mixture-of-Experts (MoE) qui totalise 230 milliards de paramètres, mais n’en active que 10 milliards par requête. Contrairement aux modèles denses comme Claude Opus, qui mobilisent l’intégralité de leurs paramètres à chaque calcul, cette approche sélective réduit considérablement la puissance de calcul nécessaire.

L’architecture intègre également des Gated Delta Networks, un mécanisme d’attention linéaire qui évite la complexité quadratique des transformeurs classiques. Résultat : des coûts d’inférence bien inférieurs pour des performances comparables sur les tâches de code.

Des performances de codage au niveau des meilleurs

Sur le benchmark SWE-Bench Verified, qui évalue la capacité à résoudre des problèmes de programmation dans un seul fichier, MiniMax M2.5 obtient 80,2 %. Claude Opus 4.6 affiche 80,8 %, un écart négligeable. Mais la surprise vient de Multi-SWE-Bench, un test plus exigeant qui mesure la coordination de modifications sur plusieurs fichiers : M2.5 atteint 51,3 % contre 50,3 % pour Opus.

Sur l’appel d’outils (benchmark BFCL), l’avance est encore plus nette : 76,8 % pour M2.5 contre 63,3 % pour Opus, soit plus de 13 points d’écart. Un atout majeur pour les développeurs qui construisent des systèmes multi-agents.

Un rapport qualité-prix qui bouscule le marché

Le token en sortie coûte 1,20 dollar par million chez MiniMax, contre 25 dollars pour Claude Opus 4.6. Par tâche SWE-Bench complète, le coût ne représente que 10 % de celui d’Opus. Ce différentiel pose une question stratégique pour les entreprises : pourquoi payer vingt fois plus pour des performances équivalentes en programmation ?

Les grandes entreprises déjà engagées dans l’écosystème Anthropic ou OpenAI changeront difficilement de fournisseur à court terme, en raison de l’intégration technique et des contrats existants. En revanche, les jeunes entreprises et les secteurs sensibles aux coûts — assistance client automatisée, assistants de code, traitement documentaire — pourraient basculer rapidement vers MiniMax.

Des limites à garder en tête

MiniMax M2.5 ne surpasse pas Claude partout. Sa fenêtre de contexte est limitée à 32 000 tokens, contre un million pour Claude Opus 4.6. Pour les tâches nécessitant l’analyse de documents longs, la rédaction créative ou le raisonnement nuancé sur de vastes corpus, Claude conserve un avantage net. La stratégie optimale pour de nombreuses équipes techniques sera donc de combiner les deux modèles selon les besoins.

FAQ

MiniMax M2.5 peut-il remplacer Claude en production ?

Pour les tâches de programmation et d’appel d’outils, oui. Les benchmarks montrent des performances équivalentes, voire supérieures sur les projets multi-fichiers. En revanche, pour la rédaction longue, l’analyse de documents volumineux ou les cas nécessitant un contexte étendu, Claude reste préférable grâce à sa fenêtre d’un million de tokens.

Les prix bas de MiniMax sont-ils durables ?

L’écart de prix reflète principalement l’efficacité technique de l’architecture MoE, qui nécessite moins de puissance de calcul par requête. MiniMax bénéficie également d’une infrastructure cloud moins coûteuse en Chine. Il ne s’agit pas d’une politique de prix artificiellement bas, mais d’un avantage structurel qui devrait perdurer.

À suivre : l’adoption de M2.5 en entreprise au deuxième trimestre 2026, la réaction tarifaire d’Anthropic et d’OpenAI, et l’éventuel durcissement des restrictions américaines sur les exportations de technologies d’IA chinoises.

Sources : Apiyi, Artificial Analysis, VentureBeat, MiniMax. Voir aussi : Claude Opus 4.6 en détail, GPT-5.4 face aux challengers.

Points clés

Une architecture pensée pour l’efficacité

Des performances de codage au niveau des meilleurs

Un rapport qualité-prix qui bouscule le marché

Des limites à garder en tête

FAQ

MiniMax M2.5 peut-il remplacer Claude en production ?

Les prix bas de MiniMax sont-ils durables ?

MegTech

Articles connexes

IA et cybersécurité : les nouvelles menaces et défenses qui redéfinissent 2026

Pourquoi les modèles IA open source gagnent du terrain face aux solutions propriétaires en 2026

Les data centers sous-marins : la solution au problème énergétique de l’IA ?

Recevez l'actu IA chaque matin