GPT-5.6 정식 출시 요약: Sol·Terra·Luna 포지셔닝과 정부 제한 프리뷰 현황
2026년 6월 27일(한국 시간), OpenAI는 GPT-5.6 시리즈 세 모델을 정식 발표하며 태양계 천체 명명 체계를 처음 도입했습니다. Sol(태양), Terra(대지), Luna(달)는 각각 플래그십, 균형, 경량 세 계층에 대응합니다. 출처: OpenAI 공식 공지, OpenAI Deployment Safety System Card, VentureBeat, SiliconAngle, TechTimes.
| 모델 | 포지션 | 입력 가격 | 출력 가격 | 핵심 지표 |
|---|---|---|---|---|
| GPT-5.6 Sol | 플래그십 / 최강 | $5 / 100만 Token | $30 / 100만 Token | TerminalBench 2.1 글로벌 1위(91.9%) |
| GPT-5.6 Terra | 균형 / 주력 | $2.50 / 100만 Token | $15 / 100만 Token | GPT-5.5급 성능, 비용 50% 절감 |
| GPT-5.6 Luna | 경량 / 고속 | $1 / 100만 Token | $6 / 100만 Token | 고빈도 작업 최적, 가격 80% 우위 |
현재 상태: 미국 정부 요청에 따라 현재 약 20개 승인 파트너만 프리뷰를 이용할 수 있으며, 수주 내 전면 공개가 예상됩니다. Polymarket은 「7월 31일까지 GPT-5.6 전면 공개」 확률을 약 87%로 예측합니다.
순탄치 않은 출시: 트럼프 행정부 6월 2일 행정명령으로 OpenAI는 광범위 공개 전 정부 안전 심사를 받아야 했습니다. 미국 정부가 AI 기업에 프론티어 모델 제한 공개를 처음 요구한 사례입니다.
알트먼 CEO 공개 입장: 심사에 협력하면서도 「이 정부 승인 모델이 업계의 장기 기본 관행이 되어서는 안 된다」고 밝혔습니다.
6월 「슈퍼 출시월」 지연: OpenAI GPT-5.6, Anthropic Claude Fable 5/Mythos 5(6월 12일 강제 중단), Google Gemini 3.5 Pro(7월 연기) 세 강 플래그십이 출시 문턱에서 멈춰 있습니다.
전 시리즈 사이버보안 High 등급: GPT-5.6은 OpenAI 역사상 처음으로 세 모델 모두 「High」 사이버보안 위험 등급에 도달한 제품군입니다.
컨텍스트 윈도우: 세 모델 모두 약 1.5M Token으로 보고되며, GPT-5.5의 1M 대비 약 50% 확대되었습니다.
「이 정부 승인 프로세스가 장기적인 업계 기본이 되어서는 안 된다고 봅니다. 최고의 도구가 정말 필요한 사용자, 개발자, 기업, 글로벌 파트너에게서 멀어지고 있습니다.」—— OpenAI CEO 샘 알트먼, 2026년 6월
GPT-5.6 Sol·Terra·Luna 상세: 가격, 추론 모드, 적용 시나리오
GPT-5.6 Sol — 플래그십 모델: OpenAI 역대 최강 모델로, 고난이도 프로그래밍, 장기간 사이버보안 연구, 다단계 자율 실행 Agentic Workflow에 최적화되었습니다. 두 가지 새로운 추론 모드를 도입했습니다.
| 추론 모드 | 메커니즘 | 적용 시나리오 |
|---|---|---|
| Max 모드 | 더 많은 추론 시간을 확보하고 속도를 희생해 정확도를 높임 | 정확성이 최우선인 시나리오 |
| Ultra 모드 | 멀티에이전트 협업 — 작업 분해, 병렬 서브에이전트 실행, 출력 통합 | 복잡한 프로그래밍과 Agent 작업(TerminalBench 91.9%의 핵심) |
GPT-5.6 Terra — 균형 모델: 일상 엔터프라이즈 업무의 핵심 주력으로, 대규모 고객 지원, 내부 도구, 문서 분석 등 고빈도 업무에 적합합니다. GPT-5.5에 근접한 성능을 50% 낮은 비용으로 제공하며, 대규모 배포 시 가성비가 가장 높습니다.
GPT-5.6 Luna — 경량 모델: 고빈도·저지연 시나리오에 최적화되어 텍스트 요약, 초안 작성, 일상 자동화에 적합합니다. Luna는 OpenAI 역사상 처음으로 사이버보안과 생물학 두 영역에서 High 능력 등급을 받은 비플래그십 모델입니다.
| 요구 사항 | 추천 모델 |
|---|---|
| 복잡한 코드 생성, 디버깅, 다단계 에이전트 작업 | Sol |
| 엔터프라이즈 문서 분석, 고객 지원, 대규모 API 호출 | Terra |
| 고빈도 요약, 초안, 일상 자동화 | Luna |
| 예산 제약 속 GPT-5.5급 성능 필요 | Terra(동등 성능, 비용 50% 절감) |
| 지연에 극도로 민감한 실시간 앱(7월 이후) | Sol on Cerebras |
GPT-5.6 벤치마크 전체 데이터: TerminalBench, CTF, ExploitBench, 생명과학
프로그래밍 능력: TerminalBench 2.1 — 89개의 복잡한 커맨드라인 계획 문제로 다단계 도구 호출, 반복 수정, 작업 조정 능력을 검증합니다.
| 모델 | 점수 | 모드 |
|---|---|---|
| GPT-5.6 Sol | 91.9% 글로벌 1위 | Ultra(멀티에이전트) |
| GPT-5.6 Sol | 88.8% | 표준 모드 |
| Claude Mythos 5 | 88.0% | 표준 |
| GPT-5.5 | 83.4% | 표준 |
| Gemini 3.1 Pro Preview | 70.7% | 표준 |
Sol은 단 17일 만에 Claude Mythos 5를 1위에서 끌어내렸습니다. 후자는 6월 9일에 막 1위에 올랐습니다.
에이전트 장기 작업: Agent's Last Exam
| 모델 | 작업 완료율(코드 모드) |
|---|---|
| GPT-5.6 Sol | 50.9%(50% 돌파 유일 모델) |
| GPT-5.6 Luna | GPT-5.5를 약간 상회 |
사이버보안: CTF 및 ExploitBench
| 모델 | CTF 적중률 |
|---|---|
| Sol | 96.7% |
| Terra | 91.84% |
| Luna | 85.19% |
ExploitBench: Sol은 Anthropic Mythos Preview와 거의 동등한 성능을 보이면서 출력 Token을 약 3분의 1만 소비해 엔터프라이즈급 보안 연구 비용을 크게 낮춥니다.
안전 고지: OpenAI 테스트에 따르면 Sol은 Chromium과 Firefox 코드베이스 평가에서 취약점과 익스플로잇 프리미티브를 식별할 수 있으나, 완전히 작동하는 익스플로잇 체인을 자율적으로 구성하지는 못하며 「Cyber Critical」 경계선 아래에 머뭅니다. 전 시리즈에 실시간 악용 분류기, 계정 수준 심사, 70만 A100 상당 GPU 시간 레드팀 테스트, 범용 탈옥 테스트가 탑재되어 있습니다.
생명과학: GeneBench v1(유전체학·정량생물학)에서 Sol은 더 적은 Token으로 GPT-5.5에 필적하거나 상회합니다. HealthBench Professional에서 Sol은 60.5점으로 GPT-5.5보다 8.7점 높습니다.
GPT-5.6 접근 권한과 선정 6단계: 제한 프리뷰에서 7월 전면 공개까지
현 단계 인지(2026년 6월): 정부 승인 약 20개 신뢰 파트너만 API와 Codex로 접근 가능합니다. 일반 사용자는 ChatGPT에서 아직 이용할 수 없습니다.
7월 공개 창구 주목: ChatGPT 전면 공개(Plus/Pro 우선), API 공개 접근, Cerebras 가속 Sol 엔터프라이즈 제공(최대 750 token/s).
프로그래밍 Agent는 Sol 우선: 복잡한 다단계 작업에 Ultra 모드를 활성화하세요. 표준 모드 대비 Token 소비가 크게 증가합니다.
대규모 업무는 Terra: GPT-5.5급 성능과 50% 비용 우위로 고객 지원, 문서 분석 등 고호출량 시나리오에 최적입니다.
고빈도 경량 작업은 Luna: $1/$6 가격이 경쟁력 있으며 High급 사이버보안 능력 등급도 갖추고 있습니다.
멀티 벤더 fallback 유지: Fable 5 중단 사건을 참고해 환경 변수로 모델 ID를 관리하고 단일 slug 하드코딩을 피하세요. 로컬 Agent 테스트에는 OpenClaw 클라우드 Mac 노드 배포가 유효합니다.
import os
PRIMARY = os.environ.get("AI_MODEL", "gpt-5.6-terra")
FALLBACKS = ["gpt-5.6-sol", "gpt-5.5", "claude-opus-4-8"]
ULTRA_TASKS = os.environ.get("ENABLE_ULTRA", "false") == "true"Cerebras 750 token/s, 정부 심사 논란, GPT-5.6 vs Claude Mythos 5 대결
속도 혁신: 7월부터 GPT-5.6 Sol이 Cerebras 하드웨어 가속 플랫폼에 배포되어 생성 속도가 최대 750 token/s에 달합니다. 비교: 현재 대부분의 플래그십 모델은 50–150 token/s입니다. 응답 시간이 기존 모델의 1/5~1/15로 단축될 수 있습니다.
| 차원 | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1(프로그래밍) | 91.9%(Ultra) / 88.8% | 88.0% |
| ExploitBench(사이버보안) | Mythos Preview와 동등, Token 사용량 1/3 | 데이터 미공개 |
| 입력 가격 | $5 / M | 기존 $10/M(현재 중단) |
| 가용성 | 제한 프리뷰 중, 수주 내 전면 공개 | 수출 규제로 중단 |
| 컨텍스트 윈도우 | 약 1.5M Token | 200K Token |
능력 돌파: Sol Ultra 멀티에이전트 모드가 프로그래밍 작업에서 글로벌 1위에 올랐고, 17일 만에 Claude Mythos 5를 1위에서 끌어내렸습니다.
효율 돌파: 동등한 보안 연구 능력에서 Token 소비는 경쟁사의 3분의 1입니다.
속도 돌파: 7월 Cerebras 750 token/s가 실시간 AI 애플리케이션의 경계를 재정의합니다.
결론: Sol은 프로그래밍과 사이버보안 특정 벤치마크에서 Mythos 5를 상회하며, 절반 가격으로 유사한 보안 연구 능력을 구현합니다. Fable 5는 SWE-bench Pro 등 다른 차원에서 여전히 우위이며, 전체 System Card 데이터 공개를 기다려야 합니다.
대안 정리: 개인 MacBook에서 Codex/Agent 워크플로 실행 시 덮개를 닫으면 연결이 끊깁니다. 순수 Linux VPS는 Xcode와 macOS 네이티브 툴체인을 실행할 수 없습니다. 저사양 머신에서 다중 Agent 동시 실행 시 swap 지연이 심각합니다. GPT-5.6 전면 공개 시점과 무관하게 7×24 온라인 macOS 호스트에서 OpenClaw, Hermes Agent, iOS CI 파이프라인을 운영하려면 프로덕션 환경에서 KVMNODE 전용 Mac Mini M4/M4 Pro가 최적해입니다. 요금제는 가격 페이지, 주문 페이지를 참조하세요. 배포 가이드는 고객 센터도 활용하세요.