Для разработчиков и техлидов, которые всё ещё выбирают модели по mental model 2025 года: в июне 2026 Claude Fable 5 исчез из-за export controls, OpenAI и Anthropic сигналят IPO, а доля китайских моделей на OpenRouter пробила 60 процентов. Статья построена на real-time traffic OpenRouter, Artificial Analysis Intelligence Index и SWE-bench Pro и закрывает рейтинги компаний и моделей, обвал US-доли с 70 до 30 процентов за год, разделение volume vs quality, таблицу выбора по use case, прогноз Q3 и пять макротрендов, плюс шесть шагов model-agnostic routing.
01

OpenRouter июнь 2026: рейтинг компаний и Top-10 моделей

OpenRouter — один из самых честных источников данных об использовании LLM: агрегирует вызовы миллионов разработчиков по всему миру, без vendor marketing, только production votes. Рейтинг показывает, какой модели реально доверяют в prod.

По компаниям (недельный объём Token, июнь 2026):

#КомпанияСтранаToken/недДоля
1DeepSeekКитай5,13T17,6%
2AnthropicСША4,34T14,8%
3GoogleСША3,66T12,5%
4OpenAIСША2,46T8,4%
5XiaomiКитай2,42T8,3%
6MiniMaxКитай2,37T8,1%
7TencentКитай2,36T8,1%
8Alibaba QwenКитай1,26T4,3%

Китайские вендоры в Top-8 дают суммарно около 46 процентов; с Moonshot и остальными developer traffic по китайским моделям уже 60%+.

По моделям (суточный объём Token, Top 10):

#МодельВендорToken/день
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B
01

Выбор по MMLU: lab scores и wallet votes часто inverse correlation — месячный bill не совпадает с ожиданиями.

02

Игнор июньских structural events: delist Fable 5, double IPO noise, China share >60% — всё три меняют routing logic.

03

Путать volume и quality: DeepSeek #1 по traffic не значит beat Opus 4.8 по capability ceiling.

04

Single-model religion: hardcoded provider после Q3 release wave быстро становится tech debt.

05

API online, host offline: закрыл lid — agent pipeline dead, никакой ranking не спасёт runtime.

02

US-модели: с 70 до 30 процентов за год — это economics, не hype

Chart, который цитировал Bloomberg, всё объясняет:

ПериодДоля US-моделей (Google + OpenAI + Anthropic)
Июнь 2025~ 70%
Июнь 2026~ 30%

Куда делись 40 процентных пунктов? В китайские модели. Это не «патриотический» трафик — аудитория OpenRouter global: US, EU, India. Выбирают DeepSeek, Xiaomi, MiniMax потому что дёшево, быстро, хватает для задачи.

«Claude на код — ~10 баксов в час. DeepSeek — меньше 50 центов.» — dev из San Diego, оригинал

Это не quality story, это economics story. Dev из Dallas описывает stack: «Hard tasks — $500/мес Claude + ChatGPT; 90% routine coding и speech через MiniMax + Kimi + MiMo — ~$200/мес.» Route by complexity, optimize cost — default playbook 2026.

03

#1 по volume ≠ #1 по quality: Opus 4.8, Fable 5 и три китайских lever

Quality ceiling: Claude Opus 4.8 всё ещё #1 overall (Artificial Analysis Intelligence Index, конец мая 2026):

МодельQuality indexSWE-bench ProЗаметка
Claude Opus 4.861,4 (#1)69,2%Long context + agents
GPT-5.559–6063,1%Ecosystem, tool calls
Gemini 3.1 Pro57Hardest reasoning
Qwen 3.7 Max57CN closed flagship
Claude Sonnet 4.680,8% (SWE-bench Verified)Writing, instruction follow

Инженер прогнал 20 tasks: Claude Opus 4.8 взял 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4. На long context Opus просто stomps.

Claude Fable 5 брал full quality score (100/100), SWE-bench Verified ~ 95%, но mid-June 2026 delisted globally из-за export controls. Status TBD. Moral: US frontier по raw capability может быть ahead — accessibility стала новой переменной.

Volume king: китайские модели рулят routine через price/performance, три lever:

01

Price: MiniMax M3 API — $0.60/M input token, примерно 1/8 от Claude Opus 4.8 ($5.00/M).

02

Good enough: daily coding, completion, translate, summarize — 80–90% top-tier quality.

03

Open weights: DeepSeek V4, MiniMax M3 — self-host, privacy concerns off the table.

Use caseМодельПочему
Hard code / AgentClaude Opus 4.8Overall #1, long context beast
Daily coding assistDeepSeek V4 Flash / MiMo-V2.5Insane $/token, fast
Max API bang-for-buckMiniMax M3$0.60/M, open weights, self-host
Long contextKimi K2.6 (1M context)Mega window, fair price
Google stackGemini 3.5 FlashNative Workspace
Realtime web searchGrok 4.3Live X/Twitter feed
Local self-hostGLM 5.2 / Kimi K2.6Top open weights
Image genChatGPT Images 2.0Best text-in-image
General chat UXGPT-5.552.5% less hallucination vs GPT-5.3, mature ecosystem
04

Шесть шагов к model-agnostic AI coding workflow

01

Tier routing by complexity: hardest 5% → Claude Opus 4.8 / GPT-5.5; routine 95% → DeepSeek V4 Flash, MiMo-V2.5 или MiniMax M3.

02

OpenRouter как единый gateway: weekly check openrouter.ai/rankings, no hardcoded model ID.

03

Billing circuit breaker + daily cap: threshold = $/M × daily volume; agent batch на cheap route по умолчанию, heavy refactor → fallback Opus.

04

Watch Q3 release window: GPT-6, Claude Opus 5, Gemini 4, DeepSeek V5 могут приземлиться за 6 недель с Aug-Sep — routing matrix нужны swap slots.

05

Enterprise compliance отдельно: China models растут у indie devs, но Fortune 500 procurement упирается в data security и US Congress oversight — compliance = ceiling.

06

Provision 7x24 agent host: Cursor, Claude Code, OpenClaw с ноутбука на dedicated cloud Mac: launchd always-on, Keychain для multi API key. См. цены и центр помощи.

2026 — год, когда agents переходят из lab в prod. По Anthropic AI Agent Status Report 2026 почти 44% Claude API calls — math и CS tasks. Во втором полугодии побеждает тот, у кого agent stack стабилен.

05

Прогноз H2: Q3 model dump и пять макротрендов

Confirmed / high-confidence (Q3 2026):

МодельВендорETAHighlight
GPT-6OpenAIAug-Sep 2026Longer context (rumor 1.5M tokens), stronger agents
Claude Opus 5Anthropic~Sep 2026Successor Opus 4.8, long-horizon agents
Gemini 4GoogleQ3 2026Multimodal++, video + audio
DeepSeek V5DeepSeekQ3 2026Open weights, 1T+ params
Grok 4.3+xAIQ3 20261M context, realtime web
GLM 5.2Z.aishippedTop open weights, strong coding

Пять макротрендов:

A

Competition axis → «best for this scenario»: five labs, 90-day window — no single «best model». Closed frontier на hardest 5%, CN open weights на remaining 95% daily volume.

B

China share растёт, enterprise compliance — cap: indie devs возможно 70%+ OpenRouter traffic; Fortune 500 вряд ли >30%.

C

Agents — real battlefield: от benchmark scores к «50-step agent workflow runs reliably».

D

IPO pressure reshapes pricing: OpenAI и Anthropic signal IPO intent в June 2026 — public-market pressure ускорит price war с CN models.

E

Local model breakthrough: к 2027 local LLM на consumer GPU (32GB RAM) может пробить SWE-bench 80% coding bar.

Note: data from OpenRouter live traffic, Artificial Analysis, SWE-bench Pro; as of 2026-07-01. Fresh rankings: openrouter.ai/rankings.

Core story: margins на model layer сжимаются fast. DeepSeek в early 2025 показал — frontier quality не требует frontier compute. Xiaomi, Tencent, MiniMax, Moonshot выбили base pricing в пол. US vendors split: OpenAI → ecosystem play; Anthropic → quality moat; Google → speed + multimodal (Gemini Flash — closed-source value pick). Middle tier «decent but expensive» исчезает.

Pure API routing не заменяет agent host: laptop lid down, export controls delist flagship, local open-weights deploy требует 96GB+ unified memory — три path, три hidden cost. Для 7x24 stable multi-model agent pipelines с hot-swap OpenRouter routes KVMNODE dedicated cloud Mac Mini обычно optimal: native Apple Silicon toolchain, flexible day/week/month billing. Цены, заказ: оформить.