- ▸ Prise en main : une preview sous cadenas
- ▸ Test en conditions réelles : ce que j'ai pu vérifier, ce qui m'a bloqué
- ▸ Le refus cyber : la fonctionnalité la plus visible
- ▸ La friction « dual-use » : le point qui agace
Moins de 24 heures après l’annonce d’un report demandé par l’administration Trump, OpenAI a publié GPT-5.6 en preview. La gamme compte trois modèles — Sol, Terra et Luna — et un tarif Sol fixé à 5 $/30 $ par million de tokens. Verdict en quatre mots : prometteur, mais sous surveillance.
| Critère | Détail |
|---|---|
| Prix | Sol : 5 $/M tokens en entrée · 30 $/M en sortie ; Terra et Luna : non communiqué |
| Disponibilité | Preview, accès encadré (processus d’accès gouvernemental) |
| Catégorie | LLM généraliste (3 modèles : Sol, Terra, Luna) |
| Note Léo | 7 / 10 (provisoire) |
Points clés – GPT-5.6 Sol s’affiche à 5 $ en entrée et 30 $ en sortie par million de tokens, soit près de la moitié du coût de Claude Fable 5 d’Anthropic (10 $/50 $). – OpenAI décrit Sol comme à l’aise en codage, en cybersécurité et en biologie, et capable de tenir la durée sur des tâches longues pour l’IA agente. – L’éditeur insiste sur la sécurité : GPT-5.6 est entraîné pour refuser l’assistance cyber non autorisée et ne pas franchir un seuil critique offensif. – Le lancement intervient dans un climat réglementaire tendu aux États-Unis, après un report demandé par l’administration Trump.
Avant de commencer : je ne suis sponsorisé par personne, et il n’y a aucun lien affilié dans cet article. J’écris ce que j’ai pu vérifier, et je dis clairement ce que je n’ai pas pu tester. C’est tout l’intérêt du Labo.
Prise en main : une preview sous cadenas
Première chose à savoir : GPT-5.6 n’est pas un lancement classique. C’est une preview, et l’accès passe par un processus encadré. On est loin du « je crée une clé API et je tape mon premier prompt en douze minutes ». Ici, le contexte réglementaire pèse sur la disponibilité.
Le timing en dit long. Selon The Verge, le modèle est sorti moins de 24 heures après l’annonce d’un report demandé par l’administration Trump. OpenAI a donc publié vite, tout en cadrant l’accès. La gamme se découpe en trois modèles : Sol, Terra et Luna. Seul Sol a un prix public à ce jour. [capture : page de présentation de la gamme GPT-5.6 avec les trois modèles]
Mon ressenti de prise en main est mitigé, et c’est honnête de le dire. La promesse technique est là, mais la friction d’accès change l’expérience. On ne juge pas un modèle gated comme un modèle ouvert. C’est un point que j’assume dans ma note provisoire plus bas.
Test en conditions réelles : ce que j’ai pu vérifier, ce qui m’a bloqué
Soyons droits dans nos bottes : une preview encadrée limite la profondeur du test. Je n’ai pas pu faire tourner une batterie de benchmarks chiffrés, car OpenAI ne communique pas de scores publics à ce stade. Ces résultats sont donc non communiqués selon les sources disponibles à ce jour. Je refuse de vous inventer un tableau de performances. À la place, j’ai concentré mes vérifications sur ce qui est documenté et observable : la posture de sécurité et le positionnement tarifaire.
Le refus cyber : la fonctionnalité la plus visible
C’est l’angle le plus défendu par OpenAI. L’éditeur écrit que « GPT-5.6 is trained to refuse prohibited cyber assistance, including when users attempt to disguise their intent or jailbreak the model ». Traduit : le modèle est censé refuser l’aide cyber interdite, même quand l’utilisateur maquille son intention ou tente un jailbreak.
L’éditeur ajoute une nuance utile pour cadrer le périmètre : le modèle « is better at helping people find and fix vulnerabilities than reliably carrying out end-to-end attacks ». Autrement dit, il vise la défense — trouver et corriger des failles — plutôt que l’exécution d’attaques de bout en bout. C’est un positionnement clair, et c’est la première fois que je vois une preview structurée à ce point autour du refus. [capture : message de refus du modèle face à une requête cyber non autorisée]
La friction « dual-use » : le point qui agace
Là où ça se complique, c’est sur les usages à double tranchant. OpenAI le reconnaît noir sur blanc : « safeguards may occasionally intervene on legitimate work, particularly in dual-use areas where defensive and offensive activity can initially look similar. That is part of what the preview is designed to test. »
En clair : les garde-fous peuvent bloquer du travail légitime, surtout quand défense et attaque se ressemblent au premier coup d’œil. Pour un développeur sécurité ou un chercheur, c’est le genre de friction qui coûte des heures. L’éditeur assume que la preview sert justement à mesurer ce taux de faux positifs. Honnête, mais ça veut dire que les premiers utilisateurs essuient les plâtres. [capture : interruption d’une tâche de sécurité défensive jugée ambiguë]
Le coût d’entraînement et la « safety stack »
OpenAI revendique sa « most robust safety stack to date » et des « strengthened protections for higher-risk activity, sensitive cyber requests, and repeated misuse ». La couche de sécurité est donc présentée comme la plus solide de la maison, avec des protections renforcées sur les activités à risque, les requêtes cyber sensibles et les abus répétés.
Côté chiffre vérifiable, l’éditeur cite « approximately 700,000 A100e GPU hours » pour le volet sécurité. Environ 700 000 heures de GPU A100e, c’est un ordre de grandeur qui situe l’investissement : on n’est pas sur un vernis marketing posé après coup, mais sur un travail intégré au cycle d’entraînement. Reste à voir, hors preview, si ce socle tient la charge sur des usages réels variés.
L’agentique long-horizon : la promesse non vérifiable
OpenAI décrit Sol comme capable de garder le cap sur des tâches à long horizon, utiles pour l’IA agente. C’est l’argument qui m’intéresse le plus en tant que testeur, parce que c’est là que la plupart des modèles décrochent. Problème : sans accès ouvert ni métrique publiée, je ne peux pas confirmer ce comportement. Je le note comme revendication non vérifiée, à creuser dès que la preview s’ouvrira. Je préfère un trou honnête dans mon test à un chiffre inventé.
Forces & limites : mon bilan sans filtre
Après ce passage au crible, voici ce que je retiens. Je sépare ce qui tient des faits de ce qui relève des limites assumées.
Pour : – Casser le prix : Sol à 5 $/30 $ se place nettement sous Claude Fable 5 (10 $/50 $), un argument concret pour les budgets serrés. – Assumer la sécurité : le refus cyber documenté et la « safety stack » la plus solide de la maison structurent la preview. – Clarifier le périmètre : OpenAI dit viser la défense plutôt que l’attaque de bout en bout, ce qui pose un cadre lisible. – Investir en amont : environ 700 000 heures de GPU A100e dédiées au volet sécurité, intégrées au cycle.
Contre : – Subir la friction dual-use : les garde-fous peuvent bloquer du travail légitime, l’éditeur le reconnaît lui-même. – Manquer de chiffres : aucun benchmark public, performances non communiquées à ce jour. – Cadenasser l’accès : la preview passe par un processus encadré, loin d’un lancement ouvert. – Laisser Terra et Luna dans le flou : prix et positionnement non communiqués.
Vs la concurrence : le match des prix
Le seul terrain où je dispose de données chiffrées comparables, c’est le tarif. Je m’y tiens, et je marque « non communiqué » partout ailleurs plutôt que de combler les trous. Voici la photographie au 26 juin 2026.
| Critère | GPT-5.6 Sol | Claude Fable 5 (Anthropic) | Autres rivaux |
|---|---|---|---|
| Prix entrée (/M tokens) | 5 $ | 10 $ | non communiqué |
| Prix sortie (/M tokens) | 30 $ | 50 $ | non communiqué |
| Écart de coût | référence | ~2× plus cher en entrée | non communiqué |
| Disponibilité | Preview encadrée | non communiqué | non communiqué |
La lecture est simple : sur l’entrée, Sol coûte deux fois moins que Claude Fable 5 ; sur la sortie, 30 $ contre 50 $. Au global, The Verge parle de « près de la moitié du coût » du modèle d’Anthropic. Pour un workload qui consomme beaucoup de tokens, l’écart se chiffre vite. Mais un prix bas ne dit rien de la qualité réelle, que je n’ai pas pu mesurer. Le tarif penche pour OpenAI ; le reste reste à prouver. À comparer aussi avec le rapport prix-performance de Claude Sonnet face à Opus et les arbitrages de coût pour les équipes IA.
Verdict : 7/10 provisoire
Ma note provisoire est de 7/10. Pourquoi pas plus haut ? Parce qu’un testeur honnête ne peut pas noter à fond un modèle qu’il n’a pas pu pousser dans ses retranchements. Le tarif est solide, la posture sécurité est sérieuse et documentée, le périmètre défensif est clair. Mais l’absence de benchmarks publics, la friction dual-use assumée et l’accès cadenassé plombent la copie.
Pour qui ? Plutôt les équipes prêtes à composer avec une preview encadrée pour profiter d’un coût agressif. En un mot : sérieux. Je réévaluerai la note dès que la preview s’ouvrira et que des chiffres tomberont. Pour suivre l’évolution, voyez aussi notre veille sur la régulation de l’IA aux États-Unis.
Pour qui est fait GPT-5.6 ? – Le dev backend au budget serré : Sol à 5 $/30 $ allège la facture face à Claude Fable 5, à condition d’accepter une preview encadrée. – Le profil sécurité défensive : trouver et corriger des failles entre dans le périmètre revendiqué — mais préparez-vous à de la friction sur les zones dual-use. – L’équipe agentique exigeante : la promesse long-horizon est attirante, à valider une fois l’accès ouvert et les métriques publiées.
FAQ
Quels sont les principaux apports de GPT-5.6 ?
GPT-5.6 introduit trois modèles — Sol, Terra et Luna — et un tarif Sol agressif à 5 $/30 $ par million de tokens. OpenAI met en avant sa couche de sécurité la plus solide à ce jour, un refus entraîné de l’assistance cyber non autorisée et une aptitude revendiquée aux tâches longues pour l’IA agente. Les performances chiffrées restent non communiquées à ce stade.
Comment OpenAI sécurise-t-il GPT-5.6 ?
Le modèle est entraîné pour refuser l’assistance cyber interdite, y compris face aux tentatives de maquillage d’intention et de jailbreak. OpenAI revendique des protections renforcées sur les activités à risque, les requêtes cyber sensibles et les abus répétés, avec environ 700 000 heures de GPU A100e consacrées à ce volet. L’éditeur admet que les garde-fous peuvent parfois bloquer du travail légitime.
Combien coûte GPT-5.6 face à la concurrence ?
Le modèle Sol s’affiche à 5 $ en entrée et 30 $ en sortie par million de tokens, selon The Verge. C’est près de la moitié du coût de Claude Fable 5 d’Anthropic, facturé 10 $ en entrée et 50 $ en sortie. Les prix de Terra et Luna ne sont pas communiqués, tout comme ceux des autres rivaux du marché à cette date.



