OpenRouter июнь 2026: рейтинг компаний и Top-10 моделей
OpenRouter — один из самых честных источников данных об использовании LLM: агрегирует вызовы миллионов разработчиков по всему миру, без vendor marketing, только production votes. Рейтинг показывает, какой модели реально доверяют в prod.
По компаниям (недельный объём Token, июнь 2026):
| # | Компания | Страна | Token/нед | Доля |
|---|---|---|---|---|
| 1 | DeepSeek | Китай | 5,13T | 17,6% |
| 2 | Anthropic | США | 4,34T | 14,8% |
| 3 | США | 3,66T | 12,5% | |
| 4 | OpenAI | США | 2,46T | 8,4% |
| 5 | Xiaomi | Китай | 2,42T | 8,3% |
| 6 | MiniMax | Китай | 2,37T | 8,1% |
| 7 | Tencent | Китай | 2,36T | 8,1% |
| 8 | Alibaba Qwen | Китай | 1,26T | 4,3% |
Китайские вендоры в Top-8 дают суммарно около 46 процентов; с Moonshot и остальными developer traffic по китайским моделям уже 60%+.
По моделям (суточный объём Token, Top 10):
| # | Модель | Вендор | Token/день |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Выбор по MMLU: lab scores и wallet votes часто inverse correlation — месячный bill не совпадает с ожиданиями.
Игнор июньских structural events: delist Fable 5, double IPO noise, China share >60% — всё три меняют routing logic.
Путать volume и quality: DeepSeek #1 по traffic не значит beat Opus 4.8 по capability ceiling.
Single-model religion: hardcoded provider после Q3 release wave быстро становится tech debt.
API online, host offline: закрыл lid — agent pipeline dead, никакой ranking не спасёт runtime.
US-модели: с 70 до 30 процентов за год — это economics, не hype
Chart, который цитировал Bloomberg, всё объясняет:
| Период | Доля US-моделей (Google + OpenAI + Anthropic) |
|---|---|
| Июнь 2025 | ~ 70% |
| Июнь 2026 | ~ 30% |
Куда делись 40 процентных пунктов? В китайские модели. Это не «патриотический» трафик — аудитория OpenRouter global: US, EU, India. Выбирают DeepSeek, Xiaomi, MiniMax потому что дёшево, быстро, хватает для задачи.
«Claude на код — ~10 баксов в час. DeepSeek — меньше 50 центов.» — dev из San Diego, оригинал
Это не quality story, это economics story. Dev из Dallas описывает stack: «Hard tasks — $500/мес Claude + ChatGPT; 90% routine coding и speech через MiniMax + Kimi + MiMo — ~$200/мес.» Route by complexity, optimize cost — default playbook 2026.
#1 по volume ≠ #1 по quality: Opus 4.8, Fable 5 и три китайских lever
Quality ceiling: Claude Opus 4.8 всё ещё #1 overall (Artificial Analysis Intelligence Index, конец мая 2026):
| Модель | Quality index | SWE-bench Pro | Заметка |
|---|---|---|---|
| Claude Opus 4.8 | 61,4 (#1) | 69,2% | Long context + agents |
| GPT-5.5 | 59–60 | 63,1% | Ecosystem, tool calls |
| Gemini 3.1 Pro | 57 | — | Hardest reasoning |
| Qwen 3.7 Max | 57 | — | CN closed flagship |
| Claude Sonnet 4.6 | — | 80,8% (SWE-bench Verified) | Writing, instruction follow |
Инженер прогнал 20 tasks: Claude Opus 4.8 взял 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4. На long context Opus просто stomps.
Claude Fable 5 брал full quality score (100/100), SWE-bench Verified ~ 95%, но mid-June 2026 delisted globally из-за export controls. Status TBD. Moral: US frontier по raw capability может быть ahead — accessibility стала новой переменной.
Volume king: китайские модели рулят routine через price/performance, три lever:
Price: MiniMax M3 API — $0.60/M input token, примерно 1/8 от Claude Opus 4.8 ($5.00/M).
Good enough: daily coding, completion, translate, summarize — 80–90% top-tier quality.
Open weights: DeepSeek V4, MiniMax M3 — self-host, privacy concerns off the table.
| Use case | Модель | Почему |
|---|---|---|
| Hard code / Agent | Claude Opus 4.8 | Overall #1, long context beast |
| Daily coding assist | DeepSeek V4 Flash / MiMo-V2.5 | Insane $/token, fast |
| Max API bang-for-buck | MiniMax M3 | $0.60/M, open weights, self-host |
| Long context | Kimi K2.6 (1M context) | Mega window, fair price |
| Google stack | Gemini 3.5 Flash | Native Workspace |
| Realtime web search | Grok 4.3 | Live X/Twitter feed |
| Local self-host | GLM 5.2 / Kimi K2.6 | Top open weights |
| Image gen | ChatGPT Images 2.0 | Best text-in-image |
| General chat UX | GPT-5.5 | 52.5% less hallucination vs GPT-5.3, mature ecosystem |
Шесть шагов к model-agnostic AI coding workflow
Tier routing by complexity: hardest 5% → Claude Opus 4.8 / GPT-5.5; routine 95% → DeepSeek V4 Flash, MiMo-V2.5 или MiniMax M3.
OpenRouter как единый gateway: weekly check openrouter.ai/rankings, no hardcoded model ID.
Billing circuit breaker + daily cap: threshold = $/M × daily volume; agent batch на cheap route по умолчанию, heavy refactor → fallback Opus.
Watch Q3 release window: GPT-6, Claude Opus 5, Gemini 4, DeepSeek V5 могут приземлиться за 6 недель с Aug-Sep — routing matrix нужны swap slots.
Enterprise compliance отдельно: China models растут у indie devs, но Fortune 500 procurement упирается в data security и US Congress oversight — compliance = ceiling.
Provision 7x24 agent host: Cursor, Claude Code, OpenClaw с ноутбука на dedicated cloud Mac: launchd always-on, Keychain для multi API key. См. цены и центр помощи.
2026 — год, когда agents переходят из lab в prod. По Anthropic AI Agent Status Report 2026 почти 44% Claude API calls — math и CS tasks. Во втором полугодии побеждает тот, у кого agent stack стабилен.
Прогноз H2: Q3 model dump и пять макротрендов
Confirmed / high-confidence (Q3 2026):
| Модель | Вендор | ETA | Highlight |
|---|---|---|---|
| GPT-6 | OpenAI | Aug-Sep 2026 | Longer context (rumor 1.5M tokens), stronger agents |
| Claude Opus 5 | Anthropic | ~Sep 2026 | Successor Opus 4.8, long-horizon agents |
| Gemini 4 | Q3 2026 | Multimodal++, video + audio | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Open weights, 1T+ params |
| Grok 4.3+ | xAI | Q3 2026 | 1M context, realtime web |
| GLM 5.2 | Z.ai | shipped | Top open weights, strong coding |
Пять макротрендов:
Competition axis → «best for this scenario»: five labs, 90-day window — no single «best model». Closed frontier на hardest 5%, CN open weights на remaining 95% daily volume.
China share растёт, enterprise compliance — cap: indie devs возможно 70%+ OpenRouter traffic; Fortune 500 вряд ли >30%.
Agents — real battlefield: от benchmark scores к «50-step agent workflow runs reliably».
IPO pressure reshapes pricing: OpenAI и Anthropic signal IPO intent в June 2026 — public-market pressure ускорит price war с CN models.
Local model breakthrough: к 2027 local LLM на consumer GPU (32GB RAM) может пробить SWE-bench 80% coding bar.
Note: data from OpenRouter live traffic, Artificial Analysis, SWE-bench Pro; as of 2026-07-01. Fresh rankings: openrouter.ai/rankings.
Core story: margins на model layer сжимаются fast. DeepSeek в early 2025 показал — frontier quality не требует frontier compute. Xiaomi, Tencent, MiniMax, Moonshot выбили base pricing в пол. US vendors split: OpenAI → ecosystem play; Anthropic → quality moat; Google → speed + multimodal (Gemini Flash — closed-source value pick). Middle tier «decent but expensive» исчезает.
Pure API routing не заменяет agent host: laptop lid down, export controls delist flagship, local open-weights deploy требует 96GB+ unified memory — три path, три hidden cost. Для 7x24 stable multi-model agent pipelines с hot-swap OpenRouter routes KVMNODE dedicated cloud Mac Mini обычно optimal: native Apple Silicon toolchain, flexible day/week/month billing. Цены, заказ: оформить.