GPT-5.6 正式リリース速覧:Sol・Terra・Luna の位置づけと政府限定プレビューの現状
2026年6月27日(日本時間)、OpenAI は GPT-5.6 シリーズ三モデルを正式発表し、初めて太陽系天体名体系を導入しました。Sol(太陽)、Terra(大地)、Luna(月)はそれぞれフラッグシップ、バランス、軽量の三層に対応します。情報源:OpenAI 公式公告、OpenAI Deployment Safety System Card、VentureBeat、SiliconAngle、TechTimes。
| モデル | 位置づけ | 入力価格 | 出力価格 | ハイライト |
|---|---|---|---|---|
| GPT-5.6 Sol | フラッグシップ / 最強 | $5 / 100万 Token | $30 / 100万 Token | TerminalBench 2.1 世界首位(91.9%) |
| GPT-5.6 Terra | バランス / 主力 | $2.50 / 100万 Token | $15 / 100万 Token | GPT-5.5 級性能、コスト50%削減 |
| GPT-5.6 Luna | 軽量 / 高速 | $1 / 100万 Token | $6 / 100万 Token | 高頻度タスク向け、価格80%優位 |
現状:米国政府の要請により、現在は約 20 社の承認パートナーのみがプレビュー利用可能で、数週間以内の全面公開が見込まれます。Polymarket は「7月31日までに GPT-5.6 が全面公開される」確率を約 87% と予測しています。
スムーズでない公開:トランプ政権の6月2日大統領令により、OpenAI は広範公開前の政府安全審査を求められました。米国政府が初めて AI 企業にフロンティアモデルの限定公開を要求した事例です。
アルトマン CEO の声明:審査に協力しつつ「この政府承認モデルが業界の長期デフォルトになるべきではない」と公言しました。
6月の「スーパーリリース月」が停滞:OpenAI GPT-5.6、Anthropic Claude Fable 5/Mythos 5(6月12日強制停止)、Google Gemini 3.5 Pro(7月に延期)の三強フラッグシップが公開の門前で足踏みしています。
全系列サイバーセキュリティ High 評価:GPT-5.6 は OpenAI 史上初めて三モデルすべてが「High」サイバーセキュリティリスク等級に到達した製品系列です。
コンテキストウィンドウ:三モデルとも約 1.5M Token と報告され、GPT-5.5 の 1M から約50%拡大しています。
「この政府承認プロセスが長期的な業界デフォルトになるべきではないと考えています。最高のツールが、本当に必要とするユーザー、開発者、企業、グローバルパートナーから遠ざけられています。」—— OpenAI CEO サム・アルトマン、2026年6月
GPT-5.6 Sol・Terra・Luna 詳解:価格、推論モード、適用シーン
GPT-5.6 Sol — フラッグシップモデル:OpenAI 史上最強モデルで、高難度プログラミング、長鎖サイバーセキュリティ研究、多段階自律実行の Agentic Workflow 向けに設計されています。二つの新推論モードを導入しました。
| 推論モード | 仕組み | 適用シーン |
|---|---|---|
| Max モード | より多くの推論時間を確保し、速度を犠牲に精度を追求 | 正確性が最優先のシーン |
| Ultra モード | マルチエージェント協調——タスク分解、並列サブエージェント実行、出力統合 | 複雑なプログラミングと Agent タスク(TerminalBench 91.9% の核心) |
GPT-5.6 Terra — バランスモデル:日常のエンタープライズ業務の主力で、大規模カスタマーサポート、社内ツール、文書分析など高頻度業務に適しています。GPT-5.5 に近い性能を 50% 低コストで提供し、大規模展開時のコストパフォーマンスが最も高い選択肢です。
GPT-5.6 Luna — 軽量モデル:高頻度・低レイテンシ向けに最適化され、テキスト要約、下書き、日常自動化に適しています。Luna は OpenAI 史上初の、サイバーセキュリティと生物学の両分野で High 能力評価を獲得した非フラッグシップモデルです。
| ニーズ | 推奨モデル |
|---|---|
| 複雑なコード生成、デバッグ、多段階エージェントタスク | Sol |
| エンタープライズ文書分析、カスタマーサポート、大規模 API 呼び出し | Terra |
| 高頻度要約、下書き、日常自動化 | Luna |
| 予算重視で GPT-5.5 級能力が必要 | Terra(同等性能、コスト50%削減) |
| レイテンシ極小のリアルタイムアプリ(7月以降) | Sol on Cerebras |
GPT-5.6 ベンチマーク全データ:TerminalBench、CTF、ExploitBench、生命科学
プログラミング能力:TerminalBench 2.1——89問の複雑なコマンドライン計画問題で、多段階ツール呼び出し、反復修正、タスク調整能力を検証します。
| モデル | スコア | モード |
|---|---|---|
| GPT-5.6 Sol | 91.9% 世界首位 | Ultra(マルチエージェント) |
| GPT-5.6 Sol | 88.8% | 標準モード |
| Claude Mythos 5 | 88.0% | 標準 |
| GPT-5.5 | 83.4% | 標準 |
| Gemini 3.1 Pro Preview | 70.7% | 標準 |
Sol はわずか 17 日間で Claude Mythos 5 を首位から引きずり下ろしました。後者は6月9日に首位に立ったばかりでした。
エージェント長タスク:Agent's Last Exam
| モデル | タスク完了率(コードモード) |
|---|---|
| GPT-5.6 Sol | 50.9%(50%突破の唯一のモデル) |
| GPT-5.6 Luna | GPT-5.5 をわずかに上回る |
サイバーセキュリティ:CTF と ExploitBench
| モデル | CTF 命中率 |
|---|---|
| Sol | 96.7% |
| Terra | 91.84% |
| Luna | 85.19% |
ExploitBench:Sol は Anthropic Mythos Preview とほぼ同等の性能を示しながら、出力 Token を約3分の1のみ消費し、エンタープライズ級セキュリティ研究コストを大幅に削減します。
安全に関する注記:OpenAI のテストでは、Sol は Chromium と Firefox コードベースの評価で脆弱性とエクスプロイトプリミティブを識別できますが、完全に機能するエクスプロイトチェーンを自律的に構築することはできず、「Cyber Critical」警戒線以下に留まっています。全系列にリアルタイム悪用分類器、アカウントレベル審査、70万 A100 相当 GPU 時間のレッドチームテスト、汎用ジェイルブレイクテストを搭載しています。
生命科学:GeneBench v1(ゲノミクスと定量生物学)で Sol はより少ない Token で GPT-5.5 に匹敵または上回ります。HealthBench Professional では Sol が 60.5 点で、GPT-5.5 より 8.7 点高いスコアです。
GPT-5.6 取得権限と選定六ステップ:限定プレビューから7月全面公開まで
現段階の認識(2026年6月):政府承認済みの約20社の信頼パートナーのみが API と Codex 経由でアクセス可能です。一般ユーザーは ChatGPT ではまだ利用できません。
7月公開ウィンドウに注目:ChatGPT 全面公開(Plus/Pro 優先)、API 一般アクセス、Cerebras 加速版 Sol のエンタープライズ向け提供(最大 750 token/s)。
プログラミング Agent は Sol 優先:複雑な多段階タスクでは Ultra モードを有効化してください。標準モードより Token 消費が大幅に増加することに注意が必要です。
大規模業務は Terra:GPT-5.5 級性能と50%コスト優位で、カスタマーサポート、文書分析など高呼び出し量シーンに最適です。
高頻度軽量タスクは Luna:$1/$6 の価格設定が競争力があり、High 級サイバーセキュリティ能力評価も備えています。
マルチベンダー fallback を維持:Fable 5 停止事件を参考に、環境変数でモデル ID を管理し、単一 slug のハードコードを避けてください。ローカル Agent テストには OpenClaw クラウド Mac ノードの展開が有効です。
import os
PRIMARY = os.environ.get("AI_MODEL", "gpt-5.6-terra")
FALLBACKS = ["gpt-5.6-sol", "gpt-5.5", "claude-opus-4-8"]
ULTRA_TASKS = os.environ.get("ENABLE_ULTRA", "false") == "true"Cerebras 750 token/s、政府審査論争、GPT-5.6 vs Claude Mythos 5 対決
速度革命:7月から GPT-5.6 Sol は Cerebras ハードウェア加速プラットフォームに展開され、生成速度は最大 750 token/s に達します。比較:現行のほとんどのフラッグシップモデルは 50–150 token/s です。応答時間は現行モデルの 1/5 から 1/15 に短縮される可能性があります。
| 次元 | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1(プログラミング) | 91.9%(Ultra)/ 88.8% | 88.0% |
| ExploitBench(サイバーセキュリティ) | Mythos Preview と同等、Token 用量は1/3 | データ未公開 |
| 入力価格 | $5 / M | 旧 $10/M(現在停止) |
| 利用可能性 | 限定プレビュー中、数週間で全面公開 | 輸出規制により停止 |
| コンテキストウィンドウ | 約1.5M Token | 200K Token |
能力の突破:Sol Ultra マルチエージェントモードがプログラミングタスクで世界首位に立ち、17日で Claude Mythos 5 を首位から引き下げました。
効率の突破:同等のセキュリティ研究能力で Token 消費は競合の3分の1です。
速度の突破:7月の Cerebras 750 token/s がリアルタイム AI アプリケーションの境界を再定義します。
結論:Sol はプログラミングとサイバーセキュリティの特定ベンチマークで Mythos 5 を上回り、半額の価格で同等のセキュリティ研究能力を実現しています。Fable 5 は SWE-bench Pro など他の次元で依然優位であり、完全な System Card データの公開を待つ必要があります。
代替案の整理:個人 MacBook で Codex / Agent ワークフローを実行すると蓋を閉じた時点で切断されます。純粋な Linux VPS では Xcode と macOS ネイティブツールチェーンが使えません。低スペックマシンで複数 Agent を同時実行すると swap 揺れが深刻です。GPT-5.6 の全面公開時期に関わらず、7×24 オンライン macOS ホストで OpenClaw、Hermes Agent、iOS CI パイプラインを稼働させるには、本番環境では KVMNODE 専有 Mac Mini M4 / M4 Pro が最適解になりやすいです。プランは 料金ページ、注文ページをご覧ください。展開の参考は ヘルプセンターもご利用ください。