GPT-5.6 кратко: позиционирование Sol, Terra, Luna и ограниченный gov-preview
27 июня 2026 (МСК) OpenAI выпустила три модели GPT-5.6 и впервые ввела именование по небесным телам — Sol (Солнце), Terra (Земля), Luna (Луна) для флагмана, баланса и лёгкого тира. Источники: официальный блог OpenAI, OpenAI Deployment Safety System Card, VentureBeat, SiliconAngle, TechTimes.
| Модель | Позиция | Цена input | Цена output | Ключевой показатель |
|---|---|---|---|---|
| GPT-5.6 Sol | Флагман / максимум | $5 / 1M токенов | $30 / 1M токенов | TerminalBench 2.1 — мировой рекорд (91,9%) |
| GPT-5.6 Terra | Баланс / workhorse | $2,50 / 1M токенов | $15 / 1M токенов | Уровень GPT-5.5, −50% стоимости |
| GPT-5.6 Luna | Лёгкий / быстрый | $1 / 1M токенов | $6 / 1M токенов | Высокочастотные задачи, −80% vs Sol |
Текущий статус: по запросу правительства США preview ограничен ~20 одобренными партнёрами; массовый доступ ожидается в течение нескольких недель. Polymarket оценивает вероятность полного релиза до 31 июля 2026 примерно в 87%.
Неровный запуск: указ Трампа от 2 июня 2026 обязывает OpenAI пройти госэкспертизу безопасности до широкого релиза — впервые США требуют ограниченный выпуск frontier-модели.
Позиция Альтмана: сотрудничество с проверкой, но публичный отказ от того, чтобы gov-approval стал долгосрочной отраслевой нормой.
«Супер-месяц» июня заблокирован: OpenAI GPT-5.6, Anthropic Claude Fable 5/Mythos 5 (принудительное отключение 12 июня), Google Gemini 3.5 Pro (перенос на июль) — все три флагмана застряли у ворот релиза.
Вся линейка — cybersecurity High: GPT-5.6 — первая семейство OpenAI, где все три тира получили уровень риска «High» в кибербезопасности.
Контекстное окно: для всех трёх моделей сообщается ~1,5M токенов — прирост ~50% к 1M у GPT-5.5.
«Мы не считаем, что этот процесс госдоступа должен стать долгосрочной отраслевой нормой. Он отдаляет лучшие инструменты от пользователей, разработчиков, предприятий и глобальных партнёров, которым они нужны.» — Сэм Альтман, CEO OpenAI, июнь 2026
GPT-5.6 Sol, Terra, Luna: цены, режимы инференса и сценарии
GPT-5.6 Sol — флагман: самая мощная модель OpenAI для сложного кода, длинных цепочек киберисследований и многошаговых agentic workflow. Два новых режима инференса:
| Режим | Механизм | Применение |
|---|---|---|
| Max | Больше времени на инференс, скорость в обмен на точность | Максимальные требования к точности |
| Ultra | Мультиагентная кооперация — декомпозиция, параллельные суб-агенты, слияние | Сложный код и agent-задачи (ядро 91,9% TerminalBench) |
GPT-5.6 Terra — баланс: enterprise workhorse для массовой поддержки, внутренних инструментов и анализа документов. Производительность близка к GPT-5.5 при 50% меньших затратах — лучший TCO при масштабе.
GPT-5.6 Luna — лёгкий тир: оптимизирован для высокочастотных низколатентных задач: суммаризация, черновики, рутинная автоматизация. Luna — первый не-флагман OpenAI с рейтингом «High» и в кибербезопасности, и в биологии.
| Задача | Рекомендуемая модель |
|---|---|
| Сложная генерация кода, отладка, многошаговые агенты | Sol |
| Enterprise-анализ документов, support, массовые API-вызовы | Terra |
| Частая суммаризация, черновики, автоматизация | Luna |
| Ограниченный бюджет, нужен уровень GPT-5.5 | Terra (тот же класс, −50% стоимости) |
| Латентно-критичные real-time приложения (с июля) | Sol on Cerebras |
Бенчмарки GPT-5.6: TerminalBench, CTF, ExploitBench, life sciences
Код: TerminalBench 2.1 — 89 сложных задач планирования в CLI, проверяющих многошаговые tool calls, итеративные фиксы и координацию.
| Модель | Score | Режим |
|---|---|---|
| GPT-5.6 Sol | 91,9% мировой рекорд | Ultra (мультиагент) |
| GPT-5.6 Sol | 88,8% | Стандарт |
| Claude Mythos 5 | 88,0% | Стандарт |
| GPT-5.5 | 83,4% | Стандарт |
| Gemini 3.1 Pro Preview | 70,7% | Стандарт |
Sol сместил Claude Mythos 5 с первого места всего за 17 дней — Mythos 5 возглавил рейтинг лишь 9 июня.
Длинные agent-задачи: Agent's Last Exam
| Модель | Task completion (code mode) |
|---|---|
| GPT-5.6 Sol | 50,9% (единственная модель выше 50%) |
| GPT-5.6 Luna | Немного выше GPT-5.5 |
Кибербезопасность: CTF и ExploitBench
| Модель | CTF hit rate |
|---|---|
| Sol | 96,7% |
| Terra | 91,84% |
| Luna | 85,19% |
ExploitBench: Sol почти паритетен Anthropic Mythos Preview, но потребляет лишь ~треть output-токенов — существенно ниже стоимость enterprise security research.
Безопасность: тесты OpenAI показывают: Sol находит уязвимости и exploit-примитивы в кодовых базах Chromium и Firefox, но не строит автономно полнофункциональную exploit-цепочку — ниже порога «Cyber Critical». Линейка включает real-time misuse classifiers, account-level review, 700 000 A100-эквивалентных GPU-часов red-teaming и универсальные jailbreak-тесты.
Life sciences: GeneBench v1 (геномика и количественная биология): Sol сопоставим или лучше GPT-5.5 при меньшем числе токенов. HealthBench Professional: Sol 60,5 баллов — +8,7 к GPT-5.5.
Доступ к GPT-5.6 и выбор модели: 6 шагов от gov-preview до июльского GA
Текущая фаза (июнь 2026): только ~20 одобренных партнёров через API и Codex; обычные пользователи ChatGPT пока без доступа.
Следить за июльским окном: GA ChatGPT (Plus/Pro в приоритете), публичный API, Sol на Cerebras для enterprise (до 750 token/s).
Для coding-агентов — Sol: включать Ultra для сложных многошаговых задач; расход токенов заметно выше стандартного режима.
Массовые нагрузки — Terra: уровень GPT-5.5 при −50% стоимости — support, анализ документов, высокий call volume.
Лёгкие частые задачи — Luna: цены $1/$6 конкурентны, плюс рейтинг cybersecurity «High».
Держать multi-vendor fallback: см. кейс отключения Fable 5 — ID моделей через env, без хардкода slug. Локальные agent-тесты: облачный Mac-узел OpenClaw.
import os
PRIMARY = os.environ.get("AI_MODEL", "gpt-5.6-terra")
FALLBACKS = ["gpt-5.6-sol", "gpt-5.5", "claude-opus-4-8"]
ULTRA_TASKS = os.environ.get("ENABLE_ULTRA", "false") == "true"Cerebras 750 token/s, госрегулирование и GPT-5.6 vs Claude Mythos 5
Скоростной скачок: с июля GPT-5.6 Sol разворачивается на платформе Cerebras с до 750 token/s. Для сравнения: большинство frontier-моделей — 50–150 token/s; latency может упасть в 5–15 раз.
| Измерение | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 (код) | 91,9% (Ultra) / 88,8% | 88,0% |
| ExploitBench (кибербез) | Паритет с Mythos Preview, 1/3 токенов | Данные не публичны |
| Цена input | $5 / M | было $10/M (offline) |
| Доступность | Ограниченный preview, GA через недели | Offline (export control) |
| Контекст | ~1,5M токенов | 200K токенов |
Прорыв по возможностям: Ultra multi-agent Sol лидирует в coding-бенчмарках и сместил Mythos 5 за 17 дней.
Прорыв по эффективности: та же security research capability при трети токенов конкурента.
Прорыв по скорости: Cerebras 750 token/s в июле меняет границы real-time AI.
Итог: Sol обходит Mythos 5 в coding и security-бенчмарках при половине цены за сопоставимую исследовательскую способность. Fable 5 силён на SWE-bench Pro; полный System Card GPT-5.6 ещё впереди.
Альтернативы: Codex/agent workflow на личном MacBook обрывается при закрытии крышки. Чистый Linux VPS не запускает Xcode и нативный macOS toolchain. Несколько агентов на слабом железе дают swap-jitter. Независимо от сроков GA GPT-5.6, для macOS-хоста 7×24 с OpenClaw, Hermes Agent и iOS CI в продакшене выделенный Mac Mini M4/M4 Pro KVMNODE — типично более стабильное решение с предсказуемым Metal-стеком и launchd-демонами. Тарифы: цены, заказ: оформить; развёртывание: центр помощи.