OpenAI continue d’accélérer la course aux modèles de langage. Lancé le 5 mars 2026, GPT-5.4 marque une étape significative avec deux avancées majeures : une fenêtre contextuelle portée à un million de tokens et une capacité de contrôle natif d’ordinateur qui préfigure l’ère des agents IA autonomes.

Un million de tokens : l’équivalent de 1 500 pages

La fenêtre contextuelle de GPT-5.4 représente plus du double de celle de GPT-5.2, qui plafonnait à 400 000 tokens. En pratique, un million de tokens correspond à environ 750 000 mots, soit l’équivalent de 1 500 pages de texte dense. Cette capacité ouvre la porte à l’analyse de documents volumineux — rapports annuels complets, bases de code entières ou corpus juridiques — en une seule passe.

Pour les développeurs, cela signifie moins de découpage artificiel des données et des interactions plus fluides avec le modèle, particulièrement dans les cas d’usage professionnels exigeants.

Le contrôle natif d’ordinateur

L’autre innovation majeure de GPT-5.4 est sa capacité à interagir directement avec les interfaces utilisateur des systèmes d’exploitation. Concrètement, le modèle peut naviguer dans des applications de bureau, cliquer, taper du texte et exécuter des workflows multi-étapes de manière autonome.

Lors des tests sur le benchmark OSWorld-V, qui simule des tâches réelles de productivité sur ordinateur, GPT-5.4 a obtenu un score de 75 %. Un résultat qui illustre les progrès considérables réalisés dans le domaine des agents IA capables d’opérer dans des environnements logiciels réels.

Trois variantes pour différents usages

OpenAI propose GPT-5.4 en plusieurs déclinaisons : une version standard, une version Pro pour les tâches les plus exigeantes et une version Thinking dotée d’un mode de raisonnement approfondi. L’API est accessible dès maintenant, avec une tarification adaptée au volume de tokens consommés.

Avec ces performances et un chiffre d’affaires désormais estimé à 2 milliards de dollars par mois, OpenAI confirme son ambition de transformer les modèles de langage en véritables assistants opérationnels. L’introduction en bourse, évoquée depuis plusieurs mois, semble plus proche que jamais.