GPT-5.4, lancé le 5 mars 2026, est le premier modèle grand public doté du computer use natif. Il intègre le raisonnement avancé de GPT-5.3-Codex, supporte jusqu’à 1 million de tokens de contexte et surpasse les professionnels humains dans 83 % des tâches évaluées par le benchmark GDPval.
Points clés
- Computer use natif — GPT-5.4 pilote des applications de bureau et navigateurs en totale autonomie, une première pour un modèle généraliste.
- Trois déclinaisons — Standard, Thinking (plan de raisonnement visible) et Pro (réservé aux plans Enterprise).
- 33 % d’erreurs factuelles en moins par rapport à GPT-5.2, selon les benchmarks internes d’OpenAI.
- Tarif API agressif — 2,50 $ par million de tokens en entrée, soit moitié moins que Claude Opus 4.6.
Computer use : comment ça fonctionne concrètement
Le computer use de GPT-5.4 permet au modèle de voir l’écran, de cliquer, de taper et de naviguer entre les applications. Concrètement, un agent GPT-5.4 peut ouvrir un tableur, extraire des données, les coller dans un e-mail, puis envoyer le message — le tout sans intervention humaine. OpenAI affirme que cette capacité repose sur un module de vision-action entraîné sur des milliers de workflows professionnels documentés.
Le benchmark GDPval, qui évalue la capacité des agents à produire du travail structuré dans 44 professions différentes, place GPT-5.4 à 83 % de performance égale ou supérieure aux professionnels humains, contre 70,9 % pour GPT-5.2. L’amélioration la plus notable concerne les tâches multi-étapes impliquant des outils bureautiques.
Thinking : un raisonnement transparent et contrôlable
La variante GPT-5.4 Thinking expose un plan de raisonnement en amont de chaque réponse. L’utilisateur peut ainsi réorienter le modèle en cours de route, avant qu’il ne consomme des milliers de tokens inutiles. Selon TechCrunch, cette fonctionnalité réduit de 40 % la consommation de tokens sur les tâches complexes par rapport à GPT-5.2.
En pratique, cela signifie que les développeurs qui utilisent l’API peuvent laisser l’utilisateur final valider ou corriger l’approche du modèle à chaque étape. Un avantage décisif pour les workflows agentic où le coût d’une mauvaise direction peut se chiffrer en dizaines de milliers de tokens.
Positionnement face à la concurrence
Mars 2026 restera comme le mois le plus dense de l’histoire des LLM : Gemini 3.1 de Google, Grok 4.20 de xAI et GPT-5.4 sont sortis à quelques jours d’intervalle. La différence principale de GPT-5.4 réside dans son orientation enterprise-first : là où Gemini 3.1 mise sur le multimodal natif et Grok 4.20 sur le web temps réel, OpenAI cible les tâches professionnelles structurées.
Côté tarification, GPT-5.4 se positionne à 2,50 $/MTok en entrée, un signal clair : OpenAI veut conquérir le marché des agents d’entreprise avant son IPO à 1 000 milliards de dollars.
Ce qu’il faut surveiller
Le computer use natif soulève des questions de sécurité majeures. Un agent qui contrôle un poste de travail peut potentiellement exfiltrer des données ou exécuter des actions non autorisées. OpenAI a intégré un système de permissions granulaires, mais les premiers retours d’entreprise montrent que la configuration par défaut est trop permissive pour un usage en production. Le cadre européen sur les agents autonomes, en cours de finalisation, pourrait imposer des garde-fous supplémentaires dès 2027.
FAQ
GPT-5.4 est-il gratuit sur ChatGPT ?
Non. GPT-5.4 Thinking est accessible aux abonnés Plus, Team et Pro. La version Pro est réservée aux plans Pro et Enterprise. Les utilisateurs gratuits restent sur GPT-5.2 mini.
Quelle différence entre GPT-5.4 Standard et Thinking ?
La version Standard répond directement. La version Thinking expose son plan de raisonnement avant de répondre, ce qui permet à l’utilisateur de corriger la direction prise par le modèle en cours de route.
Le computer use fonctionne-t-il avec n’importe quelle application ?
En théorie, oui : GPT-5.4 peut interagir avec tout ce qui s’affiche à l’écran. En pratique, les performances varient selon la complexité de l’interface. Les applications bureautiques (tableurs, traitements de texte, navigateurs) sont les mieux supportées.



