GPT-5.6 Release auf einen Blick: Sol, Terra, Luna und der begrenzte Gov-Preview-Status
Am 27. Juni 2026 (MESZ) veröffentlichte OpenAI drei GPT-5.6-Modelle und führte erstmals ein Benennungsschema nach Himmelskörpern ein — Sol (Sonne), Terra (Erde), Luna (Mond) für Flaggschiff, Balance und Leichtgewicht. Quellen: OpenAI Official Blog, OpenAI Deployment Safety System Card, VentureBeat, SiliconAngle, TechTimes.
| Modell | Positionierung | Input-Preis | Output-Preis | Highlight |
|---|---|---|---|---|
| GPT-5.6 Sol | Flaggschiff / Maximum | $5 / 1 M Token | $30 / 1 M Token | TerminalBench 2.1 Weltspitze (91,9%) |
| GPT-5.6 Terra | Balance / Workhorse | $2,50 / 1 M Token | $15 / 1 M Token | GPT-5.5-Niveau, 50% günstiger |
| GPT-5.6 Luna | Leicht / schnell | $1 / 1 M Token | $6 / 1 M Token | Hochfrequenz-Tasks, 80% Preisvorteil |
Aktueller Status: Auf US-Regierungsanfrage nur ca. 20 genehmigte Partner im Preview; breite Verfügbarkeit innerhalb weniger Wochen erwartet. Polymarket bewertet die Wahrscheinlichkeit einer vollständigen Freigabe bis 31. Juli 2026 mit ca. 87%.
Kein reibungsloser Launch: Trumps Executive Order vom 2. Juni 2026 verlangt eine Regierungs-Sicherheitsprüfung vor breiter Freigabe — erstmals fordert die US-Regierung eine limitierte Veröffentlichung eines Frontier-Modells.
Altman-Statement: Kooperation mit der Prüfung, aber klare Position: „Dieser Gov-Approval-Prozess darf nicht zum langfristigen Branchenstandard werden."
„Super-Release-Monat" Juni blockiert: OpenAI GPT-5.6, Anthropic Claude Fable 5/Mythos 5 (Zwangsabschaltung 12. Juni), Google Gemini 3.5 Pro (Verschiebung auf Juli) — alle drei Frontier-Releases stecken fest.
Gesamte Serie Cybersecurity „High": GPT-5.6 ist die erste OpenAI-Produktfamilie, bei der alle drei Tiers die „High"-Cybersecurity-Risikostufe erreichen.
Kontextfenster: Alle drei Modelle melden ca. 1,5 M Token — etwa 50% mehr als GPT-5.5 (1 M).
„Wir glauben nicht, dass dieser Regierungszugangsprozess zur langfristigen Standardpraxis werden sollte. Er hält die besten Werkzeuge von Nutzern, Entwicklern, Unternehmen und globalen Partnern fern, die sie brauchen." — OpenAI CEO Sam Altman, Juni 2026
GPT-5.6 Sol, Terra, Luna im Detail: Preise, Inferenzmodi, Einsatzszenarien
GPT-5.6 Sol — Flaggschiff: OpenAIs leistungsstärkstes Modell für anspruchsvolles Coding, lange Cybersecurity-Forschungsketten und mehrstufige Agentic Workflows. Zwei neue Inferenzmodi:
| Inferenzmodus | Mechanismus | Einsatz |
|---|---|---|
| Max-Modus | Mehr Inferenzzeit, Geschwindigkeit gegen Genauigkeit getauscht | Höchste Präzisionsanforderungen |
| Ultra-Modus | Multi-Agenten-Kooperation — Aufgabenteilung, parallele Sub-Agenten, Ergebnisfusion | Komplexes Coding und Agent-Tasks (Kern der 91,9% TerminalBench) |
GPT-5.6 Terra — Balance: Enterprise-Workhorse für Massen-Customer-Support, interne Tools und Dokumentenanalyse. GPT-5.5-nahe Leistung bei 50% niedrigeren Kosten — beste Preis-Leistung bei Skalierung.
GPT-5.6 Luna — Leichtgewicht: Für hochfrequente, latenzarme Tasks: Zusammenfassung, Entwürfe, Routine-Automation. Luna ist das erste Nicht-Flaggschiff-Modell von OpenAI mit „High"-Bewertung sowohl in Cybersecurity als auch Biologie.
| Anforderung | Empfohlenes Modell |
|---|---|
| Komplexe Code-Generierung, Debugging, Multi-Step-Agenten | Sol |
| Enterprise-Dokumentenanalyse, Support, Massen-API-Calls | Terra |
| Hochfrequente Zusammenfassung, Entwürfe, Automation | Luna |
| Budgetlimit, GPT-5.5-Niveau benötigt | Terra (gleiche Leistungsklasse, 50% günstiger) |
| Latenzkritische Echtzeit-Apps (ab Juli) | Sol on Cerebras |
GPT-5.6 Benchmark-Daten: TerminalBench, CTF, ExploitBench, Life Sciences
Coding: TerminalBench 2.1 — 89 komplexe Command-Line-Planungsaufgaben testen Multi-Step-Tool-Calls, iterative Fixes und Task-Koordination.
| Modell | Score | Modus |
|---|---|---|
| GPT-5.6 Sol | 91,9% Weltspitze | Ultra (Multi-Agent) |
| GPT-5.6 Sol | 88,8% | Standard |
| Claude Mythos 5 | 88,0% | Standard |
| GPT-5.5 | 83,4% | Standard |
| Gemini 3.1 Pro Preview | 70,7% | Standard |
Sol verdrängte Claude Mythos 5 nach nur 17 Tagen von Platz 1 — Mythos 5 hatte am 9. Juni erst die Spitze erreicht.
Long-Horizon-Agenten: Agent's Last Exam
| Modell | Task-Completion-Rate (Code-Modus) |
|---|---|
| GPT-5.6 Sol | 50,9% (einziges Modell über 50%) |
| GPT-5.6 Luna | Leicht über GPT-5.5 |
Cybersecurity: CTF & ExploitBench
| Modell | CTF-Trefferquote |
|---|---|
| Sol | 96,7% |
| Terra | 91,84% |
| Luna | 85,19% |
ExploitBench: Sol erreicht nahezu Parität mit Anthropic Mythos Preview, verbraucht aber nur etwa ein Drittel der Output-Tokens — deutlich niedrigere Kosten für Enterprise-Security-Forschung.
Sicherheitshinweis: OpenAI-Tests zeigen: Sol erkennt Schwachstellen und Exploit-Primitive in Chromium- und Firefox-Codebasen, kann aber keine vollständig funktionsfähige Exploit-Kette autonom konstruieren — unter der „Cyber Critical"-Schwelle. Die Serie umfasst Echtzeit-Missbrauchs-Klassifikatoren, Account-Level-Review, 700.000 A100-äquivalente GPU-Stunden Red-Teaming und universelle Jailbreak-Tests.
Life Sciences: GeneBench v1 (Genomik & quantitative Biologie): Sol matcht oder übertrifft GPT-5.5 mit weniger Tokens. HealthBench Professional: Sol 60,5 Punkte — +8,7 gegenüber GPT-5.5.
GPT-5.6 Zugang und Auswahl in 6 Schritten: Von Gov-Preview bis Juli-GA
Phase verstehen (Juni 2026): Nur ca. 20 staatlich geprüfte Partner via API und Codex; breite ChatGPT-Nutzung noch nicht möglich.
Juli-Fenster beobachten: ChatGPT-GA (Plus/Pro zuerst), öffentliche API, Cerebras-Sol für Enterprise (bis 750 token/s).
Coding-Agenten: Sol priorisieren: Ultra-Modus für komplexe Multi-Step-Tasks aktivieren; Token-Verbrauch deutlich höher als Standard.
Massen-Workloads: Terra: GPT-5.5-Niveau bei 50% Kostenvorteil — ideal für Support, Dokumentenanalyse, hohe Call-Volumina.
Leichte Hochfrequenz-Tasks: Luna: $1/$6-Preisstruktur plus „High"-Cybersecurity-Rating.
Multi-Vendor-Fallback pflegen: Siehe Fable-5-Offline-Fall — Modell-IDs per Umgebungsvariable, kein Hardcoding. Lokale Agent-Tests: OpenClaw Cloud-Mac-Node.
import os
PRIMARY = os.environ.get("AI_MODEL", "gpt-5.6-terra")
FALLBACKS = ["gpt-5.6-sol", "gpt-5.5", "claude-opus-4-8"]
ULTRA_TASKS = os.environ.get("ENABLE_ULTRA", "false") == "true"Cerebras 750 token/s, Regierungsreview und GPT-5.6 vs. Claude Mythos 5
Geschwindigkeitsrevolution: Ab Juli läuft GPT-5.6 Sol auf Cerebras-Hardware mit bis zu 750 token/s. Vergleich: die meisten Frontier-Modelle liegen bei 50–150 token/s — Antwortzeiten können auf 1/5 bis 1/15 sinken.
| Dimension | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 (Coding) | 91,9% (Ultra) / 88,8% | 88,0% |
| ExploitBench (Cybersecurity) | Parität mit Mythos Preview, 1/3 Tokens | Daten nicht öffentlich |
| Input-Preis | $5 / M | ehem. $10/M (offline) |
| Verfügbarkeit | Begrenztes Preview, GA in Wochen | Offline (Exportkontrolle) |
| Kontextfenster | ca. 1,5 M Token | 200 K Token |
Leistungsdurchbruch: Sol Ultra Multi-Agent dominiert Coding-Benchmarks und verdrängte Mythos 5 nach 17 Tagen.
Effizienzdurchbruch: Gleiche Security-Forschungsfähigkeit bei einem Drittel der Token-Kosten.
Geschwindigkeitsdurchbruch: Cerebras 750 token/s ab Juli verändert Echtzeit-AI-Anwendungen grundlegend.
Fazit: Sol übertrifft Mythos 5 in Coding- und Security-Benchmarks bei halbem Preis für vergleichbare Forschungsfähigkeit. Fable 5 führt weiterhin bei SWE-bench Pro; vollständiger System-Card-Vergleich ausstehend.
Alternativen im Überblick: Codex/Agent-Workflows auf dem privaten MacBook brechen beim Zuklappen ab. Reine Linux-VPS führen weder Xcode noch native macOS-Toolchains. Mehrere Agenten auf schwacher Hardware erzeugen Swap-Jitter. Unabhängig vom GPT-5.6-GA-Zeitpunkt brauchen produktive 7×24-macOS-Hosts für OpenClaw, Hermes Agent und iOS-CI — hier ist KVMNODE dediziertes Mac Mini M4/M4 Pro meist die stabilere Lösung. Bei Cloud-Verarbeitung von Prompts und Logs in EU-Rechenzentren sind Datenverarbeitungsverträge und DSGVO-konforme Auftragsverarbeitung zu prüfen. Tarife: Preise, Bestellung: Bestellen; Setup: Hilfezentrum.