OpenRouter 6月榜单全解析:公司排名与模型 Top 10
OpenRouter 是目前最具参考价值的 AI 模型使用数据来源之一——它聚合全球数百万开发者的真实调用量,不靠厂商自吹,只看代码投票。这个榜单的意义远不止于「谁用的人多」——它反映的是全球开发者真正在生产环境中信任哪个模型。
按公司排名(周 Token 量,截至 2026 年 6 月):
| 排名 | 公司 | 来源地 | 周 Token 量 | 市占率 |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 中国 | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 美国 | 4.34T | 14.8% |
| 3 | 🇺🇸 美国 | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 美国 | 2.46T | 8.4% |
| 5 | 小米 (Xiaomi) | 🇨🇳 中国 | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 中国 | 2.37T | 8.1% |
| 7 | 腾讯 (Tencent) | 🇨🇳 中国 | 2.36T | 8.1% |
| 8 | 阿里 Qwen | 🇨🇳 中国 | 1.26T | 4.3% |
中国模型合计占比约 46%(仅统计前 10 名内已标注来源的中国厂商);若计入 Moonshot 等,开发者流量层面中国模型已突破 60%。
按模型排名(日均 Token 量 Top 10):
| 排名 | 模型 | 厂商 | 日均 Token |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | 腾讯 | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | 小米 | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
仍用 MMLU 榜单选型:实验室跑分与生产钱包投票常呈反比,月底账单与预期完全背离。
忽视 6 月结构性事件:Fable 5 下架、双 IPO 传闻、中国模型份额破 60%——三者同时改变路由逻辑。
混淆用量与质量:DeepSeek 称霸流量不等于超越 Opus 4.8 的综合能力天花板。
单模型宗教:硬编码单一 Provider,Q3 密集发布后将迅速变成技术债。
API 在线、宿主离线:笔记本合盖后 Agent 流水线中断,排行榜再准也救不了运行时。
一年之内美国模型从 70% 暴跌到 30%:经济学的故事
一张 Bloomberg 引用的图表把这件事说得很清楚:
| 时间点 | 美国模型份额(Google + OpenAI + Anthropic) |
|---|---|
| 2025 年 6 月 | 约 70% |
| 2026 年 6 月 | 约 30% |
中间那 40 个百分点去哪了?全都被中国模型吃掉了。这不是中国开发者支持国产的结果——OpenRouter 的用户主体是全球开发者,其中大量来自美国、欧洲、印度。他们选择 DeepSeek、小米、MiniMax,是因为这些模型便宜、够快、够用。
「用 Claude 写代码,每小时大概花 10 美元。用 DeepSeek,不到 50 美分。」—— 圣地亚哥开发者原话
这不是质量的故事,这是经济学的故事。一位达拉斯开发者描述其组合:「复杂任务每月 $500 Claude + ChatGPT,日常 90% 编程与语音识别走 MiniMax + Kimi + MiMo,约 $200/月。」——按复杂度路由、按成本优化,才是 2026 年的主流打法。
用量第一 ≠ 质量第一:Opus 4.8、Fable 5 与中国模型三要素
质量天花板:Claude Opus 4.8 仍是综合能力第一(Artificial Analysis Intelligence Index,截至 2026 年 5 月底):
| 模型 | 综合质量指数 | SWE-bench Pro | 备注 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 长上下文与 Agent 领先 |
| GPT-5.5 | 59–60 | 63.1% | 生态与工具调用最快 |
| Gemini 3.1 Pro | 57 | — | 最难推理任务 |
| Qwen 3.7 Max | 57 | — | 中国闭源旗舰 |
| Claude Sonnet 4.6 | — | 80.8%(SWE-bench Verified) | 写作与指令遵循 |
一位工程师实测 20 个任务后的结论:Claude Opus 4.8 赢了 16 个,GPT-5.5 赢了 5 个,Gemini 3.1 Pro 赢了 4 个。特别是长上下文任务,Opus 几乎是碾压级别。
Claude Fable 5 曾在所有榜单拿下满分质量评级(100/100),SWE-bench Verified 约 95%,但因政府出口管制于 2026 年 6 月中旬全球下架,目前状态未定。它的存在说明:美国顶尖模型在纯能力层面仍然领先——只是可访问性成了新变量。
用量冠军:中国模型靠性价比统治日常任务,核心逻辑三条:
价格:MiniMax M3 API 定价仅 $0.60/M 输入 token,约为 Claude Opus 4.8($5.00/M)的 1/8。
够用:日常编程辅助、代码补全、翻译、摘要等任务,中国模型能达到顶级模型 80–90% 的效果。
开放权重:DeepSeek V4、MiniMax M3 等提供开放权重,企业可自部署,彻底消除数据隐私顾虑。
| 场景 | 推荐模型 | 理由 |
|---|---|---|
| 复杂代码 / Agent | Claude Opus 4.8 | 综合能力第一,长上下文无敌 |
| 日常编程辅助 | DeepSeek V4 Flash / MiMo-V2.5 | 性价比极高,速度快 |
| 超高性价比 API | MiniMax M3 | $0.60/M,开放权重,可自部署 |
| 长上下文处理 | Kimi K2.6(1M context) | 超长窗口,价格合理 |
| Google 生态整合 | Gemini 3.5 Flash | Google Workspace 原生支持 |
| 实时 Web 搜索 | Grok 4.3 | X/Twitter 实时内容获取 |
| 自建本地部署 | GLM 5.2 / Kimi K2.6 | 顶级开放权重模型 |
| 图像生成 | ChatGPT Images 2.0 | 文字渲染最强 |
| 日常对话综合体验 | GPT-5.5 | 较 GPT-5.3 幻觉减少 52.5%,生态完善 |
六步构建模型无关的 AI 编程工作流
按任务复杂度分层路由:最难 5% 任务走 Claude Opus 4.8 / GPT-5.5;日常 95% 走 DeepSeek V4 Flash、MiMo-V2.5 或 MiniMax M3。
接入 OpenRouter 统一网关:用 openrouter.ai/rankings 每周追踪榜单变化,避免硬编码单一模型 ID。
设账单熔断与日封顶:按百万 Token 单价 × 日调用量设阈值;Agent 批处理默认低价路由,复杂重构再回退 Opus。
关注 Q3 发布窗口:GPT-6、Claude Opus 5、Gemini 4、DeepSeek V5 可能在 8–9 月六周内密集落地,路由矩阵须预留切换位。
企业合规单独评估:中国模型在个人开发者层面份额将继续上升,但 Fortune 500 采购受数据安全与美国国会监管约束——合规是天花板。
2026 年已被业界定义为「Agent 从实验转向生产」的元年。Anthropic《2026 年 AI Agent 状态报告》显示,近 44% 的 Claude API 调用来自数学和计算机任务——下半年,谁的 Agent 能力更稳定,谁才是真正的赢家。
下半年预测:Q3 模型大爆发与五大宏观趋势
已确认或高概率发布(2026 年 Q3):
| 模型 | 厂商 | 预计时间 | 核心看点 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026 年 8–9 月 | 更长上下文(传闻 1.5M token),更强 Agent 能力 |
| Claude Opus 5 | Anthropic | 2026 年 9 月前后 | 接棒 Opus 4.8,长程 Agent 全面升级 |
| Gemini 4 | 2026 年 Q3 | 多模态升级,视频理解、音频输入全面强化 | |
| DeepSeek V5 | DeepSeek | 2026 年 Q3 | 开放权重,预计参数量破 1T,对标闭源前沿 |
| Grok 4.3+ | xAI | 2026 年 Q3 | 1M 上下文,增强实时 Web |
| GLM 5.2 | 智谱 Z.ai | 已发布 | 当前顶级开放权重之一,编程能力极强 |
五大宏观趋势预判:
竞争轴转向「谁最适合这个场景」:五大实验室 90 天窗口密集发布,不再有单一「最强模型」——闭源前沿处理最难 5%,中国开放权重处理剩余 95% 日常量。
中国模型份额继续上升,企业合规是上限:个人开发者层面或达 70%+ OpenRouter 流量,Fortune 500 采购仍难超 30%。
Agent 是真正的战场:竞争轴从 Benchmark 分数转向「能否可靠运行 50 步 Agent 工作流」。
IPO 压力重塑定价:OpenAI 与 Anthropic 均于 2026 年 6 月传出 IPO 意向,上市商业压力或加速与中国模型的价格战。
本地模型突破:预计 2027 年内,消费级 GPU(32GB 内存)上运行的本地模型将突破 SWE-bench 80% 编程能力门槛。
注意:数据来源 OpenRouter 实时流量、Artificial Analysis、SWE-bench Pro;撰写日 2026-07-01。最新榜单请访问 openrouter.ai/rankings。
这个故事的本质,是 AI 模型层的利润正在被快速压缩。DeepSeek 在 2025 年初证明:顶尖模型不需要顶尖算力。小米、腾讯、MiniMax、Moonshot 共同把基础定价打到地板价。美国厂商应对分化:OpenAI 押注生态(插件、企业集成、DALL-E、Codex Mobile);Anthropic 死守质量高地;Google 押注速度与多模态(Gemini Flash 是闭源性价比优选之一)。中间「质量不差但价格贵」的位置正在快速消失。
纯 API 路由无法替代 Agent 宿主:笔记本合盖断线、出口管制随时下架旗舰模型、本地开放权重部署又需要 96GB+ 统一内存——三条路径各有隐性成本。对于需要 7×24 稳定运行多模型 Agent 流水线、又要随时切换 OpenRouter 路由的生产环境,KVMNODE 独占 Mac Mini 云端租赁通常是更优解:Apple Silicon 原生工具链、按天/周/月弹性下单。详见 定价页,下单走 订购入口。