2026年6月24日、OpenAIとブロードコムはLLM推論向けカスタムASIC Jalapeñoを共同発表しました。早期テストでは主流AI GPU比で推論コスト約50%削減、ワット当たり性能は現行最先端を大きく上回り、TSMC 3nmで製造、設計からテープアウトまで9か月。2026年末にはMicrosoft Azureほかへ商用展開が始まります。AI開発者・インフラエンジニア・投資家向けに、自研の背景Richard HoによるアーキテクチャGPT-5.3-Codex-Spark実測Blackwell並み性能Tomahawk・Celesticaのサプライチェーン1.3GW(2027)・10GW(2029)ロードマップ、NVIDIA300億ドル投資との関係競合比較表ブロードコム株価上昇6ステップ意思決定ガイドを整理します。
01

OpenAIが自前チップを作る理由:推論コストとハイパースケーラー競争

OpenAIは世界最大級のGPU消費企業の一つです。ChatGPTへの質問一つごとに、背後のサーバークラスターが推論(Inference)で大量の演算を消費します。GPT-4・GPT-5系列の能力向上に伴い、推論コストは収益化の最大の重石となっています。

これまでOpenAIはほぼ完全にNVIDIA GPUに依存していました。H100、H200、Blackwellは強力ですが、汎用アクセラレータであり、LLM推論に特化した設計ではありません。同質化したLLMワークロードでは、汎用GPUの演算の相当部分が実質的な無駄になります。NVIDIA GPUはスイスアーミーナイフ、Jalapeñoは専用のメスという比喩がよく使われます。

01

モデルが強くなるほど請求が膨らむ:数億DAU規模で、API呼び出しのたびにGPUクラスターが稼働します。

02

汎用GPUのアーキテクチャミスマッチ:学習・ゲーム・シミュレーション向けチップで純推論を回すと、専用ASICより効率が落ちます。

03

競合は先行済み:Google TPU、Amazon Trainium/Inferentia、Microsoft Maia 100、Meta MTIAはすでに量産段階です。

04

最遅参入だが最速開発:設計からテープアウトまで9か月——高性能先端半導体分野で最速のASICサイクルと公言されています。

05

NVIDIAとの戦略的結びつきは継続:2026年2月、NVIDIAはOpenAIへ300億ドルを直接投資——学習段階では依然として中核パートナーです。

企業自研チップ用途
GoogleTPU学習 + 推論
AmazonTrainium / Inferentia学習 + 推論
MicrosoftMaia 100推論
MetaMTIA推論
OpenAIJalapeño(2026)推論
02

Jalapeñoの技術詳細:ASIC、3nm、Tomahawk、Codex-Spark実測

ASIC(Application-Specific Integrated Circuit)は、LLM推論だけを行う専用集積回路です。ゲームや学習、汎用計算は対象外です。特化領域では効率が極めて高くなります。

「Jalapeñoは白紙から設計し、最先端モデルにおけるカーネル実行、メモリ転送、ネットワーク通信、サービングパターンへの深い洞察を織り込んでいます。」—— OpenAIハードウェア責任者 Richard Ho

01

ゼロからの設計:現代LLM推論を起点に、Transformer演算パターンに最適化した判断を積み重ねています。

02

データ搬送の最小化:推論のボトルネックはメモリ帯域——計算ユニットとメモリ間の無駄な転送を削減します。

03

計算・メモリ・ネットワークの均衡:LLM実負荷に合わせたバランスで、理論ピークに近い利用率を狙います。

04

ブロードコム Tomahawk:大規模クラスター向けの強力なノード間通信。超大規模モデルのマルチカード推論に不可欠です。

05

Celesticaによる板級統合:基板・ラックシステムの量産体制を担い、スケール展開を支えます。

製造要素詳細
ウェハ代工TSMC(台湾積体電路製造)
プロセス3nm(Apple M4、NVIDIA Blackwellと同世代)
ラボ実測モデルGPT-5.3-Codex-Spark(コーディング向け旗艦推論モデル)
稼働状況エンジニアリングサンプルが目標周波数・消費電力でMLワークロードを実行済み
03

性能とコスト:50%削減、Blackwell並み、データの信頼性

以下はブロードコムCEOホック・タンおよびOpenAI公式声明に基づく早期テスト結果です。完全な技術レポートは数か月後、第三者検証は未完了——ベンダー自測値として読む必要があります。

指標Jalapeño(早期テスト)比較ベース
推論コスト削減約50%現行主流AI GPU比
ワット当たり性能現行最先端を大きく上回るOpenAI公式声明
性能絶対値NVIDIA Blackwell・Google TPUと同水準ホック・タン(Reuters)
熱特性想定を上回るOpenAI内部テスト

「これまでのところ、Jalapeñoは典型的なAI GPUと比べて約50%のコスト削減を示しています。」—— ブロードコムCEO ホック・タン(Bloomberg)

OpenAI共同創業者兼社長 Greg Brockmanは、初期設計からテープアウトまで9か月しかかからなかったと補足しました。設計・最適化の一部にはOpenAI自身のAIモデルも使用されたとVentureBeatが関係者談を報じています(世代は非公開)。

注意:「50%」は現時点ではブロードコム側の早期ラボデータです。量産後の実効値は、OpenAI技術レポート、Azure実運用、第三者ベンチマークの三段階で確認が必要です。

A

50%コスト削減:ホック・タンBloomberg取材——「典型的AI GPU」比較。

B

Blackwell同級:Reuters取材——Google TPUと並記。

C

9か月テープアウト:Greg Brockman定性——史上最速の高性能ASIC開発と評価。

04

9か月開発、サプライチェーン、Azure展開と6ステップ意思決定ガイド

なぜ9か月でテープアウトできたのか

01

ソフト・ハードの深い連携:モデルチームとチップチームが一体で動き、従来ASIC開発の「ハードがソフトを推測する」手戻りを削減しました。

02

AI支援チップ設計:OpenAIのモデルが設計判断・最適化の一部を加速しました。

03

ブロードコムの成熟IP:実装・ネットワークで再利用可能なIPが、論理設計から物理実装までの期間を短縮しました。

役割企業担当
チップアーキテクチャOpenAILLM推論最適化、フルスタック設計
実装・ネットワークブロードコム(Broadcom)シリコン実装、Tomahawk、量産支援
ウェハ代工TSMC3nm製造
システム統合Celestica基板・ラック・サーバー統合、量産
初回展開先Microsoft Azureデータセンター展開(2026年末開始)
段階時期マイルストーン
短期2026年末MicrosoftほかパートナーDCへ商用展開;ChatGPT・Codex・API内部推論を優先
中期2027年大規模量産;展開規模1.3GW超;外部AI企業への開放も検討
長期2029年まで自研チップで10GW(原子力発電所約10基規模);2028年次世代、以降年次イテレ;学習チップ拡張も視野

6ステップ意思決定ガイド(開発者・技術責任者向け):

01

学習と推論を分離:Jalapeñoは推論のみ。最先端モデルの学習は依然NVIDIA GPU——両段階の算力計画を混同しないでください。

02

50%数字は慎重に:ベンダーベンチマークとして扱い、技術レポートとAzure実運用後にTCOモデルを更新してください。

03

2026年末Azure展開を追跡:Microsoft初回稼働はコスト削減が本番で成立するかの最重要検証点です。

04

供給分散の論理:推論負荷の20〜30%でも自社ASICがあれば、NVIDIA調達価格交渉の材料になります。

05

ブロードコムASICエコシステム:Google TPU、Meta MTIA、OpenAI Jalapeño——カスタムASICはハイパースケーラーの標準装備です。

06

ローカルAgentとクラウド推論の分離:チップ降本は主にAPI価格に効きます。Cursor/Codex Agentパイプラインは安定macOSホストの24時間稼働が依然必要です。

05

競合比較、業界影響、タイムライン、キーパーソン

Jalapeñoは短期間でNVIDIAを「置き換える」ことはできません。理由は三つです。①推論のみで学習は対象外;②CUDAエコシステム(数百万開発者・最適化ライブラリ)という最深の堀;③ASICの高い特化度——LLMアーキテクチャが根本的に変われば適応コストが高い。

戦略的意味は「供給分散と交渉力」です。「NVIDIAを捨てる」ではなく「NVIDIA一択を終える」。Quilter Cheviotグローバルテック研究責任者 Ben Barringer:「Nobody wants to be beholden to Nvidia.」

次元NVIDIAJalapeño / OpenAI
学習支配的地位、CUDAエコシステム依然NVIDIA依存(300億ドル投資で結びつき)
推論汎用GPU、シェア侵食の可能性専用ASIC、50%コスト削減を目標
次世代Vera Rubinプラットフォーム2028年第二代Jalapeño、以降年次イテレ
ブロードコムカスタムASICの王者:Google TPU + Meta MTIA + OpenAI

AI業界への波及:

1

推論経済学がビジネスモデルを再編:本番で50%が検証されればChatGPT APIコストはさらに下がり、「AI価格戦争」の下限が引き下げられます。

2

フルスタックAI企業が新標準:チップアーキテクチャ、カーネル、メモリ、ネットワーク、スケジューリング、デプロイまで設計——競争は「モデル品質」から「フルスタック効率」へ。

3

半導体格局の加速分化:勝者——ブロードコム、TSMC、SK hynix/サムスン(HBM);圧力——NVIDIA推論シェア、AMD存在感。

氏名役職役割
Greg BrockmanOpenAI共同創業者・社長公開発表、「フルスタックインフラ戦略」の位置づけ
Richard HoOpenAIハードウェア責任者技術アーキテクチャのリード
ホック・タン(Hock Tan)ブロードコムCEOBlackwell並み性能・50%コスト削減を公言
Sam AltmanOpenAI CEO全体戦略、算力の命脉掌握を過去に公言
Timeline
2025-10  OpenAIとブロードコム、カスタムチップ共同開発を正式発表
2026-02  NVIDIAがOpenAIへ300億ドル直接投資(Vera Rubin算力協定含む)
2026-06-24  Jalapeño公開、エンジニアリングサンプルがラボで稼働
2026年末  初回商用展開(Azureほかパートナーデータセンター)
2027       大規模量産、展開規模1.3GW超
2028(予定) 第二代チップ発表
2029(目標) 自研チップで10GW算力規模

ブロードコム株は2026年前5か月で年間約18%上昇。2022年末以降の累積は約7倍——カスタムASICブームの直接受益者です。

現実チェック:個人MacBookでCursor + Codex Agentは蓋を閉じると停止します。Linux専用VPSはXcode隣接とmacOS Keychainを欠きます。小型機にGatewayとローカル推論を詰め込むとswapスラッシングが発生します。Jalapeñoの降本はクラウド推論層で起きます——24時間Agentオーケストレーション、安定MCPツールチェーン、OpenAIチップ本番後のコーディングスタック切替が必要な本番環境では、KVMNODE専用Mac Mini M4 / M4 Proが通常より適しています。料金注文ヘルプセンターをご覧ください。