GPT-5.6 en bref : positionnement Sol, Terra, Luna et preview gouvernementale limitée
Le 27 juin 2026 (heure de Paris), OpenAI a dévoilé trois modèles GPT-5.6 et introduit pour la première fois une nomenclature céleste — Sol (Soleil), Terra (Terre), Luna (Lune) pour flagship, équilibre et léger. Sources : blog officiel OpenAI, OpenAI Deployment Safety System Card, VentureBeat, SiliconAngle, TechTimes.
| Modèle | Position | Prix input | Prix output | Point fort |
|---|---|---|---|---|
| GPT-5.6 Sol | Flagship / maximum | 5 $ / 1 M tokens | 30 $ / 1 M tokens | TerminalBench 2.1 leader mondial (91,9%) |
| GPT-5.6 Terra | Équilibré / workhorse | 2,50 $ / 1 M tokens | 15 $ / 1 M tokens | Niveau GPT-5.5, coût −50% |
| GPT-5.6 Luna | Léger / rapide | 1 $ / 1 M tokens | 6 $ / 1 M tokens | Tâches haute fréquence, −80% vs Sol |
Statut actuel : sur demande du gouvernement américain, preview limitée à environ 20 partenaires agréés ; disponibilité générale attendue dans les semaines. Polymarket estime à 87% la probabilité d'une sortie complète avant le 31 juillet 2026.
Lancement contrarié : l'ordre exécutif du 2 juin 2026 impose une revue de sécurité gouvernementale avant diffusion large — première fois que Washington exige une publication limitée d'un modèle frontier.
Position d'Altman : coopération avec la revue, mais refus que ce processus d'approbation gouvernementale devienne la norme industrielle à long terme.
Le « super-mois » de juin bloqué : OpenAI GPT-5.6, Anthropic Claude Fable 5/Mythos 5 (coupure forcée le 12 juin), Google Gemini 3.5 Pro (reporté à juillet) — les trois flagship restent à la porte.
Cybersécurité « High » sur toute la gamme : GPT-5.6 est la première famille OpenAI dont les trois tiers atteignent le niveau de risque cybersécurité « High ».
Fenêtre de contexte : les trois modèles rapportent environ 1,5 M tokens, soit +50% par rapport au 1 M de GPT-5.5.
« Nous ne pensons pas que ce processus d'accès gouvernemental devrait devenir la norme à long terme. Il éloigne les meilleurs outils des utilisateurs, développeurs, entreprises et partenaires mondiaux qui en ont besoin. » — Sam Altman, CEO OpenAI, juin 2026
GPT-5.6 Sol, Terra, Luna : tarifs, modes d'inférence et cas d'usage
GPT-5.6 Sol — modèle flagship : le plus capable d'OpenAI, conçu pour le code complexe, la recherche cybersécurité longue durée et les workflows agentiques multi-étapes. Deux nouveaux modes d'inférence :
| Mode | Mécanisme | Usage |
|---|---|---|
| Mode Max | Plus de temps d'inférence, vitesse sacrifiée pour la précision | Exigences de justesse maximales |
| Mode Ultra | Coopération multi-agents — décomposition, sous-agents parallèles, fusion | Code complexe et tâches agent (cœur du 91,9% TerminalBench) |
GPT-5.6 Terra — modèle équilibré : pilier des workloads enterprise — support client massif, outils internes, analyse documentaire. Performance proche de GPT-5.5 à 50% de coût en moins — meilleur rapport qualité-prix à l'échelle.
GPT-5.6 Luna — modèle léger : optimisé pour haute fréquence et faible latence : résumés, brouillons, automatisation courante. Luna est le premier modèle non-flagship d'OpenAI noté « High » à la fois en cybersécurité et en biologie.
| Besoin | Modèle recommandé |
|---|---|
| Génération de code complexe, debug, agents multi-étapes | Sol |
| Analyse documentaire enterprise, support, appels API massifs | Terra |
| Résumés fréquents, brouillons, automatisation | Luna |
| Budget serré, niveau GPT-5.5 requis | Terra (même classe, −50% de coût) |
| Apps temps réel sensibles à la latence (dès juillet) | Sol on Cerebras |
Benchmarks GPT-5.6 : TerminalBench, CTF, ExploitBench et sciences de la vie
Programmation : TerminalBench 2.1 — 89 problèmes de planification en ligne de commande testant appels d'outils multi-étapes, corrections itératives et coordination.
| Modèle | Score | Mode |
|---|---|---|
| GPT-5.6 Sol | 91,9% leader mondial | Ultra (multi-agents) |
| GPT-5.6 Sol | 88,8% | Standard |
| Claude Mythos 5 | 88,0% | Standard |
| GPT-5.5 | 83,4% | Standard |
| Gemini 3.1 Pro Preview | 70,7% | Standard |
Sol a détrôné Claude Mythos 5 en seulement 17 jours — Mythos 5 venait d'atteindre la première place le 9 juin.
Agents longue durée : Agent's Last Exam
| Modèle | Taux d'achèvement (mode code) |
|---|---|
| GPT-5.6 Sol | 50,9% (seul modèle au-dessus de 50%) |
| GPT-5.6 Luna | Légèrement au-dessus de GPT-5.5 |
Cybersécurité : CTF et ExploitBench
| Modèle | Taux CTF |
|---|---|
| Sol | 96,7% |
| Terra | 91,84% |
| Luna | 85,19% |
ExploitBench : Sol égale presque Anthropic Mythos Preview tout en n'utilisant qu'environ un tiers des tokens de sortie — coûts de recherche sécurité enterprise fortement réduits.
Note sécurité : les tests OpenAI montrent que Sol identifie vulnérabilités et primitives d'exploit sur Chromium et Firefox, mais ne construit pas de chaîne d'exploit fonctionnelle de façon autonome — sous le seuil « Cyber Critical ». La gamme intègre classificateurs d'abus temps réel, revue au niveau compte, 700 000 heures GPU A100-équivalent de red-teaming et tests de jailbreak universels.
Sciences de la vie : GeneBench v1 (génomique et biologie quantitative) : Sol égale ou dépasse GPT-5.5 avec moins de tokens. HealthBench Professional : Sol 60,5 points — +8,7 vs GPT-5.5.
Accès GPT-5.6 et sélection en 6 étapes : de la preview limitée à la GA de juillet
Comprendre la phase actuelle (juin 2026) : seuls environ 20 partenaires agréés accèdent via API et Codex ; le grand public n'utilise pas encore ChatGPT.
Surveiller la fenêtre de juillet : GA ChatGPT (Plus/Pro en priorité), API publique, Sol Cerebras pour l'enterprise (jusqu'à 750 token/s).
Agents de code : privilégier Sol : activer le mode Ultra pour tâches multi-étapes complexes ; consommation de tokens nettement supérieure au mode standard.
Workloads massifs : Terra : niveau GPT-5.5 à −50% de coût — support, analyse documentaire, volumes d'appels élevés.
Tâches légères fréquentes : Luna : tarification 1 $/6 $ compétitive avec notation cybersécurité « High ».
Maintenir un fallback multi-fournisseur : voir l'arrêt de Fable 5 — IDs de modèle via variables d'environnement, pas de slug codé en dur. Tests agents locaux : nœud Mac cloud OpenClaw.
import os
PRIMARY = os.environ.get("AI_MODEL", "gpt-5.6-terra")
FALLBACKS = ["gpt-5.6-sol", "gpt-5.5", "claude-opus-4-8"]
ULTRA_TASKS = os.environ.get("ENABLE_ULTRA", "false") == "true"Cerebras 750 token/s, controverse gouvernementale et GPT-5.6 vs Claude Mythos 5
Révolution vitesse : dès juillet, GPT-5.6 Sol sera déployé sur la plateforme Cerebras avec jusqu'à 750 token/s. Référence : la plupart des modèles frontier tournent à 50–150 token/s — les temps de réponse pourraient être divisés par 5 à 15.
| Dimension | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 (code) | 91,9% (Ultra) / 88,8% | 88,0% |
| ExploitBench (cybersécurité) | Parité Mythos Preview, 1/3 des tokens | Données non publiques |
| Prix input | 5 $ / M | anc. 10 $/M (hors ligne) |
| Disponibilité | Preview limitée, GA dans les semaines | Hors ligne (contrôle export) |
| Contexte | ~1,5 M tokens | 200 K tokens |
Percée capacité : le mode Ultra multi-agents de Sol domine le code et détrône Mythos 5 en 17 jours.
Percée efficacité : même capacité de recherche sécurité pour un tiers des tokens.
Percée vitesse : Cerebras 750 token/s en juillet redéfinit les applications IA temps réel.
Conclusion : Sol surpasse Mythos 5 sur les benchmarks code et cybersécurité à moitié prix pour une capacité de recherche comparable. Fable 5 reste fort sur SWE-bench Pro ; données System Card complètes attendues.
Alternatives : Codex et workflows agent sur MacBook personnel s'interrompent à la fermeture du capot. Un VPS Linux pur n'exécute ni Xcode ni la chaîne d'outils macOS native. Plusieurs agents sur machine modeste provoquent du swap instable. Quelle que soit la date de GA GPT-5.6, un hôte macOS 7×24 pour OpenClaw, Hermes Agent et pipelines CI iOS reste indispensable en production — Mac Mini M4/M4 Pro dédié KVMNODE est souvent la solution la plus stable pour les workflows créatifs Apple. Tarifs : page tarifs, commande : commander ; déploiement : centre d'aide.