Points clés
- MiniMax M2.5 est un modèle Mixture-of-Experts de 230 milliards de paramètres, dont seulement 10 milliards sont activés par requête
- Sur le benchmark SWE-Bench, il atteint 80,2 % contre 80,8 % pour Claude Opus 4.6 — quasi-égalité
- Sur Multi-SWE-Bench (tâches multi-fichiers), M2.5 dépasse Opus avec 51,3 % contre 50,3 %
- Le coût par million de tokens en sortie s’élève à 1,20 dollar, contre 25 dollars pour Opus — soit vingt fois moins
- Temps d’exécution moyen : 22,8 minutes contre 31,3 minutes pour Opus, un gain de 37 %
La startup shanghaienne MiniMax vient de publier M2.5, un modèle de langage qui égale Claude Opus 4.6 sur les benchmarks de programmation tout en coûtant vingt fois moins cher. Ce rapport qualité-prix inédit relance le débat sur la viabilité économique des modèles premium occidentaux face aux challengers chinois.
Une architecture pensée pour l’efficacité
MiniMax M2.5 repose sur une architecture Mixture-of-Experts (MoE) qui totalise 230 milliards de paramètres, mais n’en active que 10 milliards par requête. Contrairement aux modèles denses comme Claude Opus, qui mobilisent l’intégralité de leurs paramètres à chaque calcul, cette approche sélective réduit considérablement la puissance de calcul nécessaire.
L’architecture intègre également des Gated Delta Networks, un mécanisme d’attention linéaire qui évite la complexité quadratique des transformeurs classiques. Résultat : des coûts d’inférence bien inférieurs pour des performances comparables sur les tâches de code.
Des performances de codage au niveau des meilleurs
Sur le benchmark SWE-Bench Verified, qui évalue la capacité à résoudre des problèmes de programmation dans un seul fichier, MiniMax M2.5 obtient 80,2 %. Claude Opus 4.6 affiche 80,8 %, un écart négligeable. Mais la surprise vient de Multi-SWE-Bench, un test plus exigeant qui mesure la coordination de modifications sur plusieurs fichiers : M2.5 atteint 51,3 % contre 50,3 % pour Opus.
Sur l’appel d’outils (benchmark BFCL), l’avance est encore plus nette : 76,8 % pour M2.5 contre 63,3 % pour Opus, soit plus de 13 points d’écart. Un atout majeur pour les développeurs qui construisent des systèmes multi-agents.
Un rapport qualité-prix qui bouscule le marché
Le token en sortie coûte 1,20 dollar par million chez MiniMax, contre 25 dollars pour Claude Opus 4.6. Par tâche SWE-Bench complète, le coût ne représente que 10 % de celui d’Opus. Ce différentiel pose une question stratégique pour les entreprises : pourquoi payer vingt fois plus pour des performances équivalentes en programmation ?
Les grandes entreprises déjà engagées dans l’écosystème Anthropic ou OpenAI changeront difficilement de fournisseur à court terme, en raison de l’intégration technique et des contrats existants. En revanche, les jeunes entreprises et les secteurs sensibles aux coûts — assistance client automatisée, assistants de code, traitement documentaire — pourraient basculer rapidement vers MiniMax.
Des limites à garder en tête
MiniMax M2.5 ne surpasse pas Claude partout. Sa fenêtre de contexte est limitée à 32 000 tokens, contre un million pour Claude Opus 4.6. Pour les tâches nécessitant l’analyse de documents longs, la rédaction créative ou le raisonnement nuancé sur de vastes corpus, Claude conserve un avantage net. La stratégie optimale pour de nombreuses équipes techniques sera donc de combiner les deux modèles selon les besoins.
FAQ
MiniMax M2.5 peut-il remplacer Claude en production ?
Pour les tâches de programmation et d’appel d’outils, oui. Les benchmarks montrent des performances équivalentes, voire supérieures sur les projets multi-fichiers. En revanche, pour la rédaction longue, l’analyse de documents volumineux ou les cas nécessitant un contexte étendu, Claude reste préférable grâce à sa fenêtre d’un million de tokens.
Les prix bas de MiniMax sont-ils durables ?
L’écart de prix reflète principalement l’efficacité technique de l’architecture MoE, qui nécessite moins de puissance de calcul par requête. MiniMax bénéficie également d’une infrastructure cloud moins coûteuse en Chine. Il ne s’agit pas d’une politique de prix artificiellement bas, mais d’un avantage structurel qui devrait perdurer.
À suivre : l’adoption de M2.5 en entreprise au deuxième trimestre 2026, la réaction tarifaire d’Anthropic et d’OpenAI, et l’éventuel durcissement des restrictions américaines sur les exportations de technologies d’IA chinoises.
Sources : Apiyi, Artificial Analysis, VentureBeat, MiniMax. Voir aussi : Claude Opus 4.6 en détail, GPT-5.4 face aux challengers.
