OpenRouter 6 月榜單全解析:公司排名與模型 Top 10
OpenRouter 是目前最具參考價值的 AI 模型使用資料來源之一——它聚合全球數百萬開發者的真實呼叫量,不靠廠商自吹,只看程式碼投票。這個榜單的意義遠不止於「誰用的人多」——它反映的是全球開發者真正在生產環境中信任哪個模型。
按公司排名(週 Token 量,截至 2026 年 6 月):
| 排名 | 公司 | 來源地 | 週 Token 量 | 市占率 |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 中國 | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 美國 | 4.34T | 14.8% |
| 3 | 🇺🇸 美國 | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 美國 | 2.46T | 8.4% |
| 5 | 小米 (Xiaomi) | 🇨🇳 中國 | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 中國 | 2.37T | 8.1% |
| 7 | 騰訊 (Tencent) | 🇨🇳 中國 | 2.36T | 8.1% |
| 8 | 阿里 Qwen | 🇨🇳 中國 | 1.26T | 4.3% |
中國模型合計占比約 46%(僅統計前 10 名內已標註來源的中國廠商);若計入 Moonshot 等,開發者流量層面中國模型已突破 60%。
按模型排名(日均 Token 量 Top 10):
| 排名 | 模型 | 廠商 | 日均 Token |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | 騰訊 | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | 小米 | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
仍用 MMLU 榜單選型:實驗室跑分與生產錢包投票常呈反比,月底帳單與預期完全背離。
忽視 6 月結構性事件:Fable 5 下架、雙 IPO 傳聞、中國模型份額破 60%——三者同時改變路由邏輯。
混淆用量與品質:DeepSeek 稱霸流量不等於超越 Opus 4.8 的綜合能力天花板。
單模型教條:硬編碼單一 Provider,Q3 密集發佈後將迅速變成技術債。
API 在線、宿主離線:筆電合蓋後 Agent 流水線中斷,排行榜再準也救不了執行環境。
一年之內美國模型從 70% 暴跌到 30%:經濟學的故事
一張 Bloomberg 引用的圖表把這件事說得很清楚:
| 時間點 | 美國模型份額(Google + OpenAI + Anthropic) |
|---|---|
| 2025 年 6 月 | 約 70% |
| 2026 年 6 月 | 約 30% |
中間那 40 個百分點去哪了?全都被中國模型吃掉了。這不是中國開發者支持國產的結果——OpenRouter 的使用者主體是全球開發者,其中大量來自美國、歐洲、印度。他們選擇 DeepSeek、小米、MiniMax,是因為這些模型便宜、夠快、夠用。
「用 Claude 寫程式,每小時大概花 10 美元。用 DeepSeek,不到 50 美分。」—— 聖地牙哥開發者原話
這不是品質的故事,這是經濟學的故事。一位達拉斯開發者描述其組合:「複雜任務每月 $500 Claude + ChatGPT,日常 90% 程式設計與語音辨識走 MiniMax + Kimi + MiMo,約 $200/月。」——按複雜度路由、按成本優化,才是 2026 年的主流打法。
用量第一 ≠ 品質第一:Opus 4.8、Fable 5 與中國模型三要素
品質天花板:Claude Opus 4.8 仍是綜合能力第一(Artificial Analysis Intelligence Index,截至 2026 年 5 月底):
| 模型 | 綜合品質指數 | SWE-bench Pro | 備註 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 長上下文與 Agent 領先 |
| GPT-5.5 | 59–60 | 63.1% | 生態與工具呼叫最快 |
| Gemini 3.1 Pro | 57 | — | 最難推理任務 |
| Qwen 3.7 Max | 57 | — | 中國閉源旗艦 |
| Claude Sonnet 4.6 | — | 80.8%(SWE-bench Verified) | 寫作與指令遵循 |
一位工程師實測 20 個任務後的結論:Claude Opus 4.8 贏了 16 個,GPT-5.5 贏了 5 個,Gemini 3.1 Pro 贏了 4 個。特別是長上下文任務,Opus 幾乎是碾壓級別。
Claude Fable 5 曾在所有榜單拿下滿分品質評級(100/100),SWE-bench Verified 約 95%,但因政府出口管制於 2026 年 6 月中旬全球下架,目前狀態未定。它的存在說明:美國頂尖模型在純能力層面仍然領先——只是可存取性成了新變數。
用量冠軍:中國模型靠性價比統治日常任務,核心邏輯三條:
價格:MiniMax M3 API 定價僅 $0.60/M 輸入 token,約為 Claude Opus 4.8($5.00/M)的 1/8。
夠用:日常程式設計輔助、程式碼補全、翻譯、摘要等任務,中國模型能達到頂級模型 80–90% 的效果。
開放權重:DeepSeek V4、MiniMax M3 等提供開放權重,企業可自託管,徹底消除資料隱私顧慮。
| 場景 | 推薦模型 | 理由 |
|---|---|---|
| 複雜程式碼 / Agent | Claude Opus 4.8 | 綜合能力第一,長上下文無敵 |
| 日常程式設計輔助 | DeepSeek V4 Flash / MiMo-V2.5 | 性價比極高,速度快 |
| 超高性價比 API | MiniMax M3 | $0.60/M,開放權重,可自託管 |
| 長上下文處理 | Kimi K2.6(1M context) | 超長視窗,價格合理 |
| Google 生態整合 | Gemini 3.5 Flash | Google Workspace 原生支援 |
| 即時 Web 搜尋 | Grok 4.3 | X/Twitter 即時內容取得 |
| 自建本地部署 | GLM 5.2 / Kimi K2.6 | 頂級開放權重模型 |
| 圖像生成 | ChatGPT Images 2.0 | 文字渲染最強 |
| 日常對話綜合體驗 | GPT-5.5 | 較 GPT-5.3 幻覺減少 52.5%,生態完善 |
六步構建模型無關的 AI 程式設計工作流
按任務複雜度分層路由:最難 5% 任務走 Claude Opus 4.8 / GPT-5.5;日常 95% 走 DeepSeek V4 Flash、MiMo-V2.5 或 MiniMax M3。
接入 OpenRouter 統一閘道:用 openrouter.ai/rankings 每週追蹤榜單變化,避免硬編碼單一模型 ID。
設帳單熔斷與日封頂:按百萬 Token 單價 × 日呼叫量設閾值;Agent 批次處理預設低價路由,複雜重構再回退 Opus。
關注 Q3 發佈窗口:GPT-6、Claude Opus 5、Gemini 4、DeepSeek V5 可能在 8–9 月六週內密集落地,路由矩陣須預留切換位。
企業合規單獨評估:中國模型在個人開發者層面份額將繼續上升,但 Fortune 500 採購受資料安全與美國國會監管約束——合規是天花板。
2026 年已被業界定義為「Agent 從實驗轉向生產」的元年。Anthropic《2026 年 AI Agent 狀態報告》顯示,近 44% 的 Claude API 呼叫來自數學和電腦任務——下半年,誰的 Agent 能力更穩定,誰才是真正的贏家。
下半年預測:Q3 模型大爆發與五大宏觀趨勢
已確認或高機率發佈(2026 年 Q3):
| 模型 | 廠商 | 預計時間 | 核心看點 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026 年 8–9 月 | 更長上下文(傳聞 1.5M token),更強 Agent 能力 |
| Claude Opus 5 | Anthropic | 2026 年 9 月前後 | 接棒 Opus 4.8,長程 Agent 全面升級 |
| Gemini 4 | 2026 年 Q3 | 多模態升級,影片理解、音訊輸入全面強化 | |
| DeepSeek V5 | DeepSeek | 2026 年 Q3 | 開放權重,預計參數量破 1T,對標閉源前沿 |
| Grok 4.3+ | xAI | 2026 年 Q3 | 1M 上下文,增強即時 Web |
| GLM 5.2 | 智譜 Z.ai | 已發佈 | 當前頂級開放權重之一,程式設計能力極強 |
五大宏觀趨勢預判:
競爭軸轉向「誰最適合這個場景」:五大實驗室 90 天窗口密集發佈,不再有單一「最強模型」——閉源前沿處理最難 5%,中國開放權重處理剩餘 95% 日常量。
中國模型份額繼續上升,企業合規是上限:個人開發者層面或達 70%+ OpenRouter 流量,Fortune 500 採購仍難超 30%。
Agent 是真正的戰場:競爭軸從 Benchmark 分數轉向「能否可靠執行 50 步 Agent 工作流」。
IPO 壓力重塑定價:OpenAI 與 Anthropic 均於 2026 年 6 月傳出 IPO 意向,上市商業壓力或加速與中國模型的價格戰。
本地模型突破:預計 2027 年內,消費級 GPU(32GB 記憶體)上執行的本地模型將突破 SWE-bench 80% 程式設計能力門檻。
注意:資料來源 OpenRouter 即時流量、Artificial Analysis、SWE-bench Pro;撰寫日 2026-07-01。最新榜單請造訪 openrouter.ai/rankings。
這個故事的本質,是 AI 模型層的利潤正在被快速壓縮。DeepSeek 在 2025 年初證明:頂尖模型不需要頂尖算力。小米、騰訊、MiniMax、Moonshot 共同把基礎定價打到地板價。美國廠商應對分化:OpenAI 押注生態(外掛、企業整合、DALL-E、Codex Mobile);Anthropic 死守品質高地;Google 押注速度與多模態(Gemini Flash 是閉源性價比優選之一)。中間「品質不差但價格貴」的位置正在快速消失。
純 API 路由無法替代 Agent 宿主:筆電合蓋斷線、出口管制隨時下架旗艦模型、本地開放權重部署又需要 96GB+ 統一記憶體——三條路徑各有隱性成本。對於需要 7×24 穩定執行多模型 Agent 流水線、又要隨時切換 OpenRouter 路由的生產環境,KVMNODE 獨占 Mac Mini 雲端租用通常是更優解:Apple Silicon 原生工具鏈、按天/週/月彈性下單。詳見 定價頁,下單走 訂購入口。