Grok 4.20 : xAI dévoile un modèle de raisonnement qui défie GPT-5.4

xAI, la société d’Elon Musk, a lancé Grok 4.20 le 22 mars 2026. Entraîné sur le supercalculateur Colossus (100 000 GPU H100), ce modèle affiche des performances record en raisonnement mathématique et scientifique. Il est accessible gratuitement aux abonnés X Premium et via l’API xAI.

Table of Contents

Points clés

Grok 4.20 lancé le 22 mars 2026, deux jours après Gemini 3.1
Entraîné sur Colossus : 100 000 GPU H100 NVIDIA, le plus grand cluster IA privé
Score de 94,2 % sur MATH-500, surpassant GPT-5.4 (91,8 %) et Claude 4.6 (92,1 %)
Accès gratuit pour les 180 millions d’abonnés X Premium
xAI valorisée à 75 milliards de dollars après sa dernière levée de fonds

Colossus : l’avantage infrastructure de xAI

La force de xAI réside dans son infrastructure. Le supercalculateur Colossus, installé à Memphis (Tennessee), aligne 100 000 GPU NVIDIA H100 interconnectés par un réseau InfiniBand à 400 Gbit/s. Cette puissance brute permet un entraînement plus long et plus intensif que ce que la plupart des concurrents peuvent se permettre. Selon xAI, l’entraînement de Grok 4.20 a duré 11 semaines et consommé l’équivalent énergétique d’une ville de 50 000 habitants.

Elon Musk a déclaré sur X que Grok 4.20 représente « le premier modèle véritablement conçu pour le raisonnement scientifique de niveau doctoral ». Une affirmation difficile à vérifier indépendamment, mais les benchmarks publics confirment des résultats solides : 94,2 % sur MATH-500 (problèmes mathématiques de niveau universitaire), 88,7 % sur GPQA Diamond (questions scientifiques expert-level) et 81,3 % sur ARC-AGI (raisonnement abstrait).

Positionnement face à la concurrence

Mars 2026 a vu débarquer GPT-5.4, Claude 4.6, Gemini 3.1 et maintenant Grok 4.20 en l’espace de trois semaines. La différence de positionnement est nette. GPT-5.4 mise sur la polyvalence et le computer use natif. Claude 4.6 excelle en raisonnement long et en coding. Gemini 3.1 domine la multimodalité. Grok 4.20 cible le raisonnement STEM (science, technologie, ingénierie, mathématiques).

Cette spécialisation n’est pas anodine. Le marché des modèles de langage se segmente désormais par cas d’usage plutôt que par classement général. Selon Gartner, 62 % des entreprises utilisant l’IA en 2026 emploient au moins trois modèles différents selon les tâches.

Accès et modèle économique

Grok 4.20 est accessible sans surcoût pour les abonnés X Premium (16 dollars par mois) et X Premium+ (22 dollars par mois). L’API xAI facture 2 dollars par million de tokens en entrée et 6 dollars en sortie, soit le tarif le plus agressif du marché pour un modèle de cette catégorie. xAI compense par le volume : la plateforme X génère environ 500 milliards de tokens par jour en interactions avec Grok.

La valorisation de xAI atteint 75 milliards de dollars après un tour de table de 6 milliards en février 2026. Cela place la société au même niveau qu’Anthropic (60 milliards) et loin derrière OpenAI (300 milliards estimés).

Analyse

Grok 4.20 confirme que xAI n’est plus un outsider. Le modèle rivalise sérieusement avec les leaders sur le raisonnement STEM et propose un rapport qualité-prix difficile à ignorer. Reste la question de la fiabilité à long terme : xAI n’a pas encore publié de rapport de sécurité indépendant pour Grok 4.20, contrairement à Anthropic et OpenAI qui soumettent leurs modèles à des audits tiers. Pour les professionnels et chercheurs, Grok 4.20 mérite une évaluation sérieuse. Pour le grand public, l’intégration native dans X en fait le modèle le plus accessible du marché.

FAQ

Grok 4.20 est-il gratuit ?

Il est inclus dans l’abonnement X Premium (16 dollars/mois). L’API est payante à l’usage. Il n’existe pas de version entièrement gratuite.

Grok 4.20 est-il open source ?

Non. xAI a ouvert les poids de Grok 1 et Grok 1.5 par le passé, mais Grok 4.20 reste propriétaire. L’entreprise n’a pas annoncé de calendrier d’ouverture.

Quelles sont les limites de Grok 4.20 ?

Le modèle excelle en STEM mais reste en retrait sur les tâches créatives et la rédaction longue par rapport à Claude 4.6. Sa fenêtre de contexte (256 000 tokens) est inférieure à celle de GPT-5.4 (1 million) et Gemini 3.1 (2 millions).

Points clés

Colossus : l’avantage infrastructure de xAI

Positionnement face à la concurrence

Accès et modèle économique

Analyse

FAQ

Grok 4.20 est-il gratuit ?

Grok 4.20 est-il open source ?

Quelles sont les limites de Grok 4.20 ?

Matteo Voss

Articles connexes

Deepfakes : comment les détecter et s’en protéger en 2026

Comment l’IA transforme l’éducation : état des lieux et perspectives 2026

L’ONU alerte : « L’intelligence artificielle doit servir la démocratie, pas la remplacer »

Recevez l'actu IA chaque matin