為什麼 Token 帳單比 Benchmark 排行榜更誠實?
OpenRouter 是全球最大的中立 AI 模型 API 聚合平台:接入 300+ 模型、覆蓋 60+ 供應商,超 800 萬使用者,平台月處理量約 100 兆 Token。其公開排行榜(openrouter.ai/rankings)依按週(7 天滾動)Token 吞吐量排序——誰被開發者反覆付費呼叫,誰就在榜上。這與 MMLU、HumanEval 等靜態 Benchmark 截然不同:後者衡量「實驗室單次跑分」,前者衡量「正式環境錢包投票」。
OpenRouter 與 a16z 聯合發布的《2025 AI 使用報告》(覆蓋 100 兆 Token 匿名中繼資料)揭示了一個反直覺結論:模型的 Benchmark 分數與其實際市場份額幾乎呈反比。開發者更關注推理成本與 API 穩定性,而非極限能力;程式設計任務占比從 2025 年初的 11% 飆升至超 50%,成為最大單一用途。因此,花出去的錢不會說謊——Token 呼叫量是衡量 AI 真實落地與市場認可度的「體溫計」。
只盯 Benchmark:SWE-bench 高分模型在你的 Agent 流水線裡可能是高頻小任務 + 長上下文讀儲存庫,帳單與延遲完全另一套曲線。
忽視週波動:OpenRouter 按週更新,只看月報或發表會口徑會錯過 Hy3、Owl Alpha 等「新進爆款」訊號。
混淆 Token 與美元:Anthropic Token 份額約 12%,美元收入份額卻約 46%——只看呼叫量會誤判「誰贏了 AI 競賽」。
單模型教條:團隊禁止切換路由,程式設計用 Sonnet、批次處理卻仍在同一單價,月費失控。
API 線上、宿主離線:筆電合蓋後 OpenClaw / Claude Code 背景任務中斷,排行榜再準也救不了執行環境。
一年前 OpenRouter 週處理量約 2.4 兆 Token,2026 年 5 月第三週已達 28.9 兆,成長約 12 倍——AI 應用已進入規模化爆發階段。接下來我們用最新一週帳單資料,回答「誰才是真正的王者」。
2026 年 5 月第三週:28.9 兆 Token 與中美格局
統計週期:2026 年 5 月 18 日 – 5 月 24 日(OpenRouter 官方按週 7 天滾動口徑)。下表彙總全球與中美的週呼叫量及環比變化;中國模型已連續四週超越美國,穩居全球首位。
| 指標 | 資料 | 環比變化 | 解讀 |
|---|---|---|---|
| 全球週呼叫量 | 28.9 兆 Token | +7.4% | 連續五週上漲 |
| 中國模型週呼叫量 | 9.223 兆 Token | +19.89% | 增速顯著高於全球均值 |
| 美國模型週呼叫量 | 4.93 兆 Token | +16.27% | 絕對量仍低於中國 |
| 中國模型流量占比 | ~45%+ | — | 2025 年初 <2%,2026 年 2 月首次超美 |
數量級感知:從 2025 年初中國模型在 OpenRouter 上占比不足 2%,到 2026 年 2 月首次超越美國,再到 5 月連續四週領先——這不是偶然波動,而是極低成本開源模型 + Agent 工作流爆發的結構性轉移。投資者用這張榜評估 AI 商業化進度(OpenRouter 估值約 26× PS),開發者用它選擇「不押寶單一廠商」的路由策略,媒體用它判斷「誰在真正贏得 AI 競賽」。
Token 呼叫量已從「技術指標」升級為「商業戰場晴雨表」——每週更新的公開資料,比任何發表會都更接近真相。
當週 Top 10 與廠商「Token vs 美元」雙重真相
下表為 2026 年 5 月 18–24 日當週模型維度 Top 10(依週 Token 量)。DeepSeek 旗下三款模型同時進入前九,系列週呼叫總量 5.74 兆 Token(環比 +25.9%),連續兩週超越 Anthropic 和 Google,位居廠商排名第一。
| 排名 | 模型 | 廠商 | 週 Token 量 | 環比 | 特點 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek(中國) | 3.43T | +66% | Agent 工作流首選,極低價格 |
| 2 | 騰訊 Hy3 Preview | Tencent(中國) | 3.07T | +16% | 限免結束後仍高成長 |
| 3 | Claude Sonnet 4.6 | Anthropic(美國) | 1.35T | — | 百萬上下文,企業程式設計主力 |
| 4 | DeepSeek-V3.2 | DeepSeek(中國) | 1.31T | — | 低價長尾,角色扮演活躍 |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29% | 免費 Agent 特化,百萬上下文 |
| 6 | Gemini 3 Flash Preview | Google(美國) | 1.06T | — | 多模態,學術/醫療場景 |
| 7 | DeepSeek-V4-Pro | DeepSeek(中國) | 1.00T | — | 矩陣旗艦(系列合計 5.74T) |
| 8 | MiniMax M2.7 | MiniMax(中國) | 806B | — | 長上下文性價比之選 |
| 9 | Grok 4.1 Fast | xAI(美國) | 721B | — | 2M 上下文,法律場景強勢 |
| 10 | Step 3.5 Flash | StepFun(中國) | 673B | — | 快速低價,批次處理場景 |
若只看 Token 量,DeepSeek 與騰訊 Hy3 已佔據榜首;但若看美元收入份額,格局完全不同。Anthropic 呈現典型的「溢價悖論」:
| 廠商層級 | Token 份額 | 美元收入份額 | 代表模型 | 定位 |
|---|---|---|---|---|
| 高價值·低流量 | ~12%(Anthropic,下滑) | ~46% | Claude Opus 4.6 | 企業複雜推理,付費能力強 |
| 性價比·中流量 | ~13% | ~7% | Gemini 3 Flash | 多模態、學術 |
| 極低價·高流量 | DeepSeek 系列 5.74T/週 | <1% | V4-Flash / V3.2 | Agent、程式設計、批次處理 |
Claude Opus 4.6 月收入約 2500 萬美元,但 Token 量只有 DeepSeek 的零頭——企業級使用者仍為 Claude 付高價,流量主導權卻已拱手相讓。這不是「Anthropic 輸了」,而是市場正在分層:不是誰最聰明,而是誰最被呼叫,才能推動 AI 真正落地。
六步按週追蹤 OpenRouter 排行並調整路由策略
固定每週一查看榜單:造訪 openrouter.ai/rankings,記錄 Top 10 模型、廠商市場份額、程式設計/多模態分類排行;OpenRouter 免費公開,無需註冊即可瀏覽。
按任務場景對應模型:Agent / 批次任務 → DeepSeek-V4-Flash;企業級複雜推理 → Claude Opus 系列;多模態需求 → Gemini Flash 系列;原型驗證 → Owl Alpha 等免費層(注意 Stealth 模型資料政策)。
對比 Token 份額與美元份額:在 OpenRouter 廠商檢視下同時看兩項指標,避免「流量冠軍 ≠ 收入冠軍」的誤判;預算規劃應基於你的任務單價敏感度,而非榜單名次 alone。
關注新進榜單模型:如 Hy3 Preview、Owl Alpha 等當週增速 >20% 的模型,往往是下一個爆款的先兆;在 OpenRouter 控制台做 1–2 天 A/B 路由後再擴大流量。
建立帳單熔斷與路由矩陣:依百萬 Token 單價 × 日呼叫量設日封頂;預設路由 DeepSeek V4 Flash,複雜重構回退 Claude Sonnet/Opus,多模態走 Gemini——避免全員 Sonnet。
六步中,團隊最常跳過第 3 步與第 6 步:前者導致用 Token 冠軍做預算卻撞上美元溢價模型,後者導致「API 選對了、Agent 夜裡仍斷線」。OpenRouter 只解決模型供給,不解決執行環境可靠性。
可引用資料、市場分層與 KVMNODE 雲 Mac 選型
全球週呼叫量(OpenRouter 公開,2026-05-18–24):28.9 兆 Token,環比 +7.4%,連續五週上漲;一年前約 2.4 兆,成長約 12 倍(來源:OpenRouter Rankings + 每日經濟新聞 2026-05-25 報導)。
DeepSeek 矩陣(同期):V4-Flash 3.43T + V4-Pro 1.00T + V3.2 1.31T = 系列合計 5.74 兆 Token,環比 +25.9%,廠商排名第一;V4-Flash 單週 +66% 解釋 Agent 工作流爆發(來源:OpenRouter + MACCOME 同期解讀)。
Anthropic 溢價悖論(a16z/OpenRouter 2025 報告 + 5 月榜單):Token 份額約 12%(一年前 25%),美元收入份額約 46%;程式設計任務占平台用途從 11% 升至 50%+,低價路由重塑流量格局(來源:OpenRouter × a16z《2025 AI 使用報告》)。
注意:排行榜按週波動,撰寫日資料截止 2026-05-24;最新即時資料請造訪 openrouter.ai/rankings。新進模型(如 Kimi K2.6)可能在一週內進出 Top 10。
純 API 路由無法替代 Agent 宿主:筆電合蓋斷線、免費 Stealth 模型可能記錄 Prompt、本機 ds4 推理又需要 96GB+ 統一記憶體門檻——三條路徑各有隱性成本。對於需要 7×24 穩定執行 Cursor / OpenClaw / Claude Code、又要按週切換 OpenRouter 路由的正式環境,KVMNODE 獨佔 Mac Mini 雲端租用通常是更優解:Apple Silicon 原生工具鏈、按天/週/月彈性下單、六區節點可選。詳見 定價頁,下單走 訂購入口。