99,8 % des tokens d'OpenAI passent par Codex : la bascule agentique

📋 En bref

Entre août 2025 et mai 2026, un agent de codage a cessé d'être un assistant ponctuel pour devenir le canal principal de production interne d'OpenAI. Le tra

▸ Un seuil franchi en moins d'un an
▸ La thèse : l'unité de mesure du travail se déplace
▸ D'où l'on vient : de l'autocomplétion à l'agent autonome
▸ Analyse technique : ce que disent vraiment les pourcentages

Entre août 2025 et mai 2026, un agent de codage a cessé d’être un assistant ponctuel pour devenir le canal principal de production interne d’OpenAI. Le travailleur moyen y générait moins de 10 % de ses tokens il y a un an ; il en produit plus de 85 % aujourd’hui. La métrique la plus parlante n’est pas la performance d’un modèle, mais la part de travail déléguée à un agent autonome. Ce dossier en mesure l’ampleur, en interroge la méthode, et en cartographie les zones d’ombre.

🤖 Transparence IA — Cet article a été rédigé avec l'assistance d'outils d'IA générative à partir de sources primaires identifiées, puis relu et validé par Mohamed Meguedmi, fondateur de LagazetteIA.

Points clés – Bascule mesurée : la part de Codex dans les tokens de sortie du travailleur moyen d’OpenAI est passée de moins de 10 % en août 2025 à plus de 85 % aujourd’hui. – Tâches longues : en mai 2026, 80,6 % des utilisateurs individuels échantillonnés ont lancé au moins une requête Codex estimée à plus de 30 minutes de travail humain, et 25,6 % au moins une dépassant huit heures. – Concentration extrême : parce que les utilisateurs intensifs consomment davantage, Codex capte 99,8 % des tokens de sortie hebdomadaires générés au sein d’OpenAI. – Diffusion hors ingénierie : l’avocat ou le recruteur moyen d’OpenAI génère désormais plus de 85 % de ses tokens via Codex, et non via ChatGPT. – Précaution de lecture : ces chiffres reposent sur un échantillon aléatoire de 0,1 % des utilisateurs et sur des données individuelles, ce qui appelle une lecture prudente.

Sommaire

Un seuil franchi en moins d’un an

L’histoire tient dans deux nombres séparés par dix mois. Jusqu’en août 2025, le collaborateur moyen d’OpenAI consacrait moins de 10 % de ses tokens à Codex, l’agent de codage maison. Le reste partait vers ChatGPT et les usages conversationnels classiques. Dix mois plus tard, le rapport s’est inversé : Codex concentre plus de 85 % des tokens de sortie du même travailleur moyen.

Ce basculement ne s’est pas produit dans un laboratoire de recherche isolé, mais à l’échelle d’une organisation entière, métiers techniques et non techniques confondus. C’est ce qui rend l’observation digne d’examen : elle décrit moins une prouesse de modèle qu’un changement de comportement de travail, documenté chiffres à l’appui par OpenAI dans sa publication du 25 juin 2026, How agents are transforming work. Le point d’inflexion mérite qu’on en démonte le mécanisme plutôt qu’on en célèbre l’allure.

La thèse : l’unité de mesure du travail se déplace

L’angle de ce dossier est simple. Tant que l’on jugeait les modèles d’IA à la justesse d’une réponse, l’unité pertinente était la requête : une question, une réponse, un humain qui valide. Avec les agents, l’unité devient la tâche : une intention, une série d’appels d’outils enchaînés, un résultat livré après plusieurs minutes — parfois plusieurs heures — sans supervision continue.

Les données d’OpenAI illustrent précisément ce glissement. Quand 25,6 % des utilisateurs échantillonnés lancent au moins une requête équivalant à plus de huit heures de travail humain, ce n’est plus un assistant que l’on interroge, mais un exécutant à qui l’on confie un chantier. La question n’est donc pas « le modèle est-il plus intelligent ? » mais « quelle fraction du travail bascule du côté de l’agent ? ». Le reste de l’analyse découle de cette reformulation.

D’où l’on vient : de l’autocomplétion à l’agent autonome

Pour mesurer la distance parcourue, il faut rappeler l’état antérieur. Les premiers outils d’assistance au code, dans la lignée des complétions automatiques, fonctionnaient à l’intérieur de l’éditeur du développeur. Ils proposaient la ligne suivante, suggéraient une fonction, accéléraient la frappe. L’humain restait aux commandes à chaque seconde : il acceptait, refusait, corrigeait, et le gain se mesurait en frappes économisées.

Le modèle conversationnel, incarné par ChatGPT, a élargi le périmètre. On ne complétait plus une ligne, on posait une question entière et l’on recevait un bloc de code, une explication, un brouillon. Mais la boucle restait courte : une requête, une réponse, un humain qui reprend la main pour intégrer le résultat. L’essentiel de la valeur transitait par cette navette permanente entre la personne et l’outil. C’est précisément cette navette que l’approche agentique réorganise.

Un agent comme Codex n’attend pas chaque validation. Il orchestre des appels d’outils, interagit avec un environnement — fichiers, dépôts, commandes — et itère vers une solution sur une durée étendue. La différence n’est pas de degré, elle est de nature. Là où l’assistant répondait, l’agent travaille. Là où la requête se comptait en secondes, la tâche se compte en minutes ou en heures. C’est ce changement de granularité que traduisent les chiffres d’OpenAI : la migration de moins de 10 % à plus de 85 % des tokens vers Codex n’est pas une montée en popularité, c’est un transfert de la charge de travail vers un format différent.

Ce contexte éclaire la suite. Si l’on ignore que l’unité de travail a changé, on lit les pourcentages comme une simple bataille de produits — Codex contre ChatGPT. En réalité, ils décrivent l’adoption d’un nouveau régime de production, où la machine tient le volant sur des segments entiers du parcours. La part de marché interne n’est qu’un symptôme ; la cause est le format agentique lui-même.

Analyse technique : ce que disent vraiment les pourcentages

Entrons dans le détail des mesures. Trois familles de chiffres structurent l’observation d’OpenAI, et chacune éclaire une dimension distincte du phénomène : la part de production, la durée des tâches, et la diffusion entre métiers.

Premier axe, la part de production. Pour le travailleur moyen d’OpenAI, Codex représente aujourd’hui plus de 85 % des tokens de sortie. Mais l’entreprise ajoute une nuance décisive : comme les utilisateurs de Codex consomment davantage de tokens que les non-utilisateurs, la part de l’agent dans l’ensemble des tokens grimpe encore. Rapportée au volume hebdomadaire total généré au sein d’OpenAI, elle atteint 99,8 %. Autrement dit, la quasi-totalité de la production textuelle interne de l’entreprise passe désormais par l’agent. Le chiffre-phare de ce dossier est là : 99,8 %.

Deuxième axe, la durée. C’est sans doute la mesure la plus révélatrice du changement de nature évoqué plus haut. En mai 2026, 80,6 % des utilisateurs individuels échantillonnés avaient lancé au moins une requête Codex estimée à plus de 30 minutes de travail humain. La proportion atteint 70,2 % pour des tâches estimées à plus d’une heure, et 25,6 % pour des tâches dépassant huit heures. Un quart des utilisateurs confie donc à l’agent au moins un chantier équivalant à une journée de travail.

Troisième axe, la trajectoire. Ces seuils ne sont pas figés : ils progressent. De décembre 2025 à mai 2026, la part d’utilisateurs ayant lancé une requête correspondant à plus de 30 minutes de travail humain est montée jusqu’à 80,6 %. Sur la même fenêtre, celle des requêtes dépassant une heure a grimpé à 70,2 %. En six mois, le curseur de confiance accordé à l’agent pour des tâches longues s’est déplacé vers le haut.

Le tableau ci-dessous synthétise ces ordres de grandeur.

Indicateur	Valeur	Source
Part de Codex chez le travailleur moyen — août 2025	< 10 % des tokens	OpenAI, 2026
Part de Codex chez le travailleur moyen — aujourd’hui	> 85 % des tokens	OpenAI, 2026
Part de Codex dans les tokens hebdomadaires globaux	99,8 %	OpenAI, 2026
Utilisateurs avec ≥ 1 requête > 30 min de travail humain (mai 2026)	80,6 %	OpenAI, 2026
Utilisateurs avec ≥ 1 requête > 1 h	70,2 %	OpenAI, 2026
Utilisateurs avec ≥ 1 requête > 8 h	25,6 %	OpenAI, 2026
Tokens générés via Codex par l’ingénieur moyen	99 %	OpenAI, 2026
Tokens générés via Codex par l’avocat / recruteur moyen	> 85 %	OpenAI, 2026

Lus ensemble, ces axes racontent une histoire cohérente. La part de production explose parce que la durée des tâches s’allonge ; la durée s’allonge parce que les utilisateurs déplacent le curseur de confiance ; et ce déplacement se diffuse au-delà des seuls ingénieurs. Reste à mesurer ce dernier point : la propagation hors du périmètre technique, qui fait l’objet de la section suivante.

Impact terrain : Codex sort du périmètre des ingénieurs

L’observation la plus contre-intuitive ne concerne pas les développeurs. Que l’ingénieur moyen d’OpenAI génère 99 % de ses tokens de sortie via Codex plutôt que via ChatGPT confirme une intuition : un agent de codage trouve naturellement sa place chez ceux qui écrivent du code. Ce résultat, attendu, n’aurait pas suffi à faire dossier.

Le signal fort est ailleurs. L’avocat ou le recruteur moyen d’OpenAI génère désormais plus de 85 % de ses tokens de sortie sur Codex. Un outil pensé pour l’ingénierie logicielle est devenu le canal principal de production de métiers sans rapport direct avec la programmation. Ce franchissement de frontière interroge la définition même d’un « agent de codage » : si un juriste y produit l’essentiel de son travail, l’objet n’est plus un assistant de développement, mais un environnement d’exécution de tâches générique dont le code n’est qu’un cas d’usage parmi d’autres.

Concrètement, cela suggère qu’un agent capable d’orchestrer des outils, de manipuler des fichiers et d’itérer vers un résultat répond à des besoins qui débordent largement l’ingénierie. Rédaction de documents structurés, tri et qualification de candidatures, assemblage de pièces, vérifications croisées : autant de tâches longues, séquentielles, automatisables par enchaînement d’actions. La frontière entre « outil de développeur » et « outil de bureau » se brouille, et cette dissolution est sans doute la conséquence terrain la plus tangible des chiffres d’OpenAI.

Il faut toutefois garder une réserve. Ces observations portent sur les collaborateurs d’OpenAI — une population d’adoptants particulièrement précoces, immergés dans la culture et les outils de l’entreprise qui produit Codex. La diffusion à un avocat ou un recruteur d’un cabinet extérieur, sans cet environnement, reste à documenter. Ce que les données prouvent, c’est la faisabilité ; ce qu’elles ne prouvent pas encore, c’est la généralisation. Cette distinction conduit directement à l’examen critique de la méthode.

Perspectives contradictoires : ce que les chiffres ne disent pas

Un dossier d’analyse se doit de retourner ses propres données. Trois objections méritent d’être posées, non pour invalider l’observation, mais pour en cerner la portée exacte.

Première limite, la source. Les chiffres proviennent d’OpenAI et décrivent OpenAI, mesurés sur le produit d’OpenAI. L’entreprise évalue ici l’adoption de son propre agent par ses propres équipes. Cela ne disqualifie pas les données — elles restent un témoignage interne précieux — mais cela interdit d’en tirer une loi générale sur « le travail » au sens large. Selon les sources disponibles à ce jour, aucune contre-mesure indépendante portant sur le même périmètre n’a été publiée pour corroborer ou nuancer ces résultats.

Deuxième limite, l’échantillon. OpenAI précise que ces résultats reposent sur des données individuelles et sur les requêtes d’un échantillon aléatoire de 0,1 % des utilisateurs. Un échantillon aléatoire est une pratique statistique solide, mais sa faible fraction et son cadre individuel invitent à manier les décimales avec prudence. Un écart entre 80,6 % et, disons, 78 % ne changerait rien à la tendance ; il rappelle simplement que ces pourcentages sont des estimations, non des recensements exhaustifs.

Troisième limite, la métrique elle-même. La part de tokens de sortie mesure un volume de production, pas une valeur créée. Qu’un agent génère 99,8 % des tokens ne signifie pas qu’il accomplit 99,8 % du travail utile : un humain conçoit l’intention, cadre la demande, vérifie et corrige le résultat. De même, l’estimation qu’une requête « correspond à plus de huit heures de travail humain » repose sur une évaluation de l’équivalent humain d’une tâche — une approximation, non une mesure chronométrée. Le token est une unité de débit ; il ne dit rien, à lui seul, de la qualité ni de la pertinence du livrable.

Ces réserves ne renversent pas la thèse. Elles la précisent : on observe un transfert massif et rapide du volume de production vers un format agentique, au sein d’une organisation d’adoptants précoces, sur une métrique de débit. C’est beaucoup, et c’est moins qu’une preuve que « le travail » dans son ensemble a déjà basculé. Tenir les deux propositions ensemble est la condition d’une lecture honnête, et c’est sur cet équilibre que s’ouvre la prospective.

Prospective : la tâche longue comme nouveau standard

Si une tendance se dégage, c’est celle de l’allongement continu des tâches confiées à l’agent. En six mois, la part d’utilisateurs lui déléguant des chantiers de plus d’une heure est montée à 70,2 %, et un quart franchit déjà le seuil des huit heures. Rien dans les données fournies n’indique un plafond atteint ; la courbe pointe vers le haut sur la fenêtre observée.

Deux questions structureront la suite. La première porte sur la diffusion : ce qui s’observe chez les collaborateurs d’OpenAI se reproduira-t-il dans des organisations dépourvues de cette proximité culturelle et technique avec l’outil ? La seconde porte sur la mesure : continuera-t-on à juger l’adoption au volume de tokens, ou faudra-t-il inventer des métriques de valeur, capables de distinguer un chantier de huit heures réellement productif d’un débit sans résultat exploitable ? Tant que ces deux questions restent ouvertes, le basculement documenté par OpenAI vaut comme signal fort et comme avertissement méthodologique — la quantité de production mesurée ne se confond pas avec la transformation du travail qu’elle laisse entrevoir.

FAQ

Qu’est-ce qu’un agent IA et en quoi diffère-t-il d’un assistant comme ChatGPT ?

Un agent comme Codex exécute une tâche de bout en bout : il orchestre des appels d’outils, interagit avec un environnement (fichiers, commandes) et itère vers une solution sur une durée étendue, sans validation à chaque étape. Un assistant conversationnel répond à une requête isolée, l’humain reprenant la main entre chaque échange. La différence se mesure en durée : secondes pour la requête, minutes ou heures pour la tâche.

Que signifie le chiffre de 99,8 % des tokens chez OpenAI ?

Il indique que Codex génère 99,8 % des tokens de sortie hebdomadaires produits au sein d’OpenAI. Ce taux dépasse les 85 % du travailleur moyen parce que les utilisateurs de Codex consomment davantage de tokens que les non-utilisateurs, ce qui gonfle la part de l’agent dans le volume global. Attention : ce chiffre mesure un débit de production, pas une valeur de travail créée.

Codex n’est-il utilisé que par des développeurs ?

Non. Si l’ingénieur moyen d’OpenAI génère 99 % de ses tokens via Codex, l’avocat ou le recruteur moyen de l’entreprise en génère déjà plus de 85 %. Un outil conçu pour l’ingénierie logicielle est devenu le canal principal de production de métiers non techniques, ce qui en élargit la définition au-delà du seul code.

Peut-on généraliser ces chiffres à toutes les entreprises ?

Avec prudence. Ces données décrivent les collaborateurs d’OpenAI, adoptants précoces de leur propre outil, et reposent sur un échantillon aléatoire de 0,1 % des utilisateurs à partir de données individuelles. Elles prouvent la faisabilité d’une délégation massive, pas sa généralisation automatique à des organisations extérieures dépourvues du même environnement.

Sources – OpenAI, How agents are transforming work, 25 juin 2026 — https://openai.com/index/how-agents-are-transforming-work
Pour prolonger : notre dossier sur la course aux agents de codage, Anthropic et la course aux 1M de tokens, Mistral face à l’open-weight.

Mes lectures

Newsletter IA

99,8 % des tokens d’OpenAI passent par Codex : la bascule agentique

Un seuil franchi en moins d’un an

La thèse : l’unité de mesure du travail se déplace

D’où l’on vient : de l’autocomplétion à l’agent autonome

Analyse technique : ce que disent vraiment les pourcentages

Impact terrain : Codex sort du périmètre des ingénieurs

Perspectives contradictoires : ce que les chiffres ne disent pas

Prospective : la tâche longue comme nouveau standard

FAQ

Qu’est-ce qu’un agent IA et en quoi diffère-t-il d’un assistant comme ChatGPT ?

Que signifie le chiffre de 99,8 % des tokens chez OpenAI ?

Codex n’est-il utilisé que par des développeurs ?

Peut-on généraliser ces chiffres à toutes les entreprises ?

Mohamed Meguedmi

Guides & Thèmes

Mes lectures

Newsletter IA

Un seuil franchi en moins d’un an

La thèse : l’unité de mesure du travail se déplace

D’où l’on vient : de l’autocomplétion à l’agent autonome

Analyse technique : ce que disent vraiment les pourcentages

Impact terrain : Codex sort du périmètre des ingénieurs

Perspectives contradictoires : ce que les chiffres ne disent pas

Prospective : la tâche longue comme nouveau standard

FAQ

Qu’est-ce qu’un agent IA et en quoi diffère-t-il d’un assistant comme ChatGPT ?

Que signifie le chiffre de 99,8 % des tokens chez OpenAI ?

Codex n’est-il utilisé que par des développeurs ?

Peut-on généraliser ces chiffres à toutes les entreprises ?

Articles similaires

Mohamed Meguedmi

L'IA chaque semaine dans votre boîte

Pour aller plus loin

Macy’s repense le retail : l’IA comme socle de décision

Sceye : plateforme solaire volante pour un meilleur internet

Figma ajoute le motion design et les shaders IA à Config 2026

L'actu IA chaque semaine

Guides & Thèmes