Какая модель была самой популярной на OpenRouter в июне 2026?

По суточному объёму Token лидирует DeepSeek V4 Flash с 619B, далее Tencent Hy3 Preview (451B) и MiniMax M3 (447B). По недельному объёму Token на компанию DeepSeek на первом месте с 5,13T (17,6 процента).

DeepSeek лучше Claude?

Зависит от сценария. Claude Opus 4.8 лидирует в Artificial Analysis Intelligence Index с 61,4 балла — для сложного кода и длинных agent context. DeepSeek V4 Flash доминирует по объёму OpenRouter с insane price/performance: разработчик из San Diego оценивает Claude в ~10 USD/час на код, DeepSeek — меньше 0,50 USD.

Какие крупные релизы ждут во второй половине 2026?

Высокая вероятность: GPT-6 (OpenAI, август-сентябрь), Claude Opus 5 (Anthropic, около сентября), Gemini 4 (Google, Q3), DeepSeek V5 (open weights, ~1T параметров), GLM 5.2 (Z.ai, уже вышел).

Почему у китайских моделей такая большая доля на OpenRouter?

Три структурных фактора: цена (MiniMax M3 всего 0,60 USD за миллион Token — примерно 1/8 от Claude Opus 4.8 за 5,00 USD), достаточное качество для рутины (80-90 процентов топовых моделей) и open weights (DeepSeek V4, MiniMax M3 для self-host). Пользователи OpenRouter глобальные, не только из Китая.

Что случилось с Claude Fable 5?

Claude Fable 5 брал максимум качества (100 из 100) во всех рейтингах, но в середине июня 2026 был снят глобально из-за US export controls. Статус неясен. Это показывает: US frontier по чистой capability всё ещё может быть впереди.

Какая runtime-среда нужна для multi-model routing?

Agent-хосты вроде Cursor, Claude Code и OpenClaw требуют macOS 7x24 и Keychain для нескольких API Key. Выделенные Mac Mini KVMNODE деплоятся по дням, неделям или месяцам. См. страницу цен.

Рейтинг AI-моделей июнь 2026: китайские LLM захватили OpenRouter — на кого ставить во втором полугодии?

Для разработчиков и техлидов, которые всё ещё выбирают модели по mental model 2025 года: в июне 2026 Claude Fable 5 исчез из-за export controls, OpenAI и Anthropic сигналят IPO, а доля китайских моделей на OpenRouter пробила 60 процентов. Статья построена на real-time traffic OpenRouter, Artificial Analysis Intelligence Index и SWE-bench Pro и закрывает рейтинги компаний и моделей, обвал US-доли с 70 до 30 процентов за год, разделение volume vs quality, таблицу выбора по use case, прогноз Q3 и пять макротрендов, плюс шесть шагов model-agnostic routing.

OpenRouter июнь 2026: рейтинг компаний и Top-10 моделей

OpenRouter — один из самых честных источников данных об использовании LLM: агрегирует вызовы миллионов разработчиков по всему миру, без vendor marketing, только production votes. Рейтинг показывает, какой модели реально доверяют в prod.

По компаниям (недельный объём Token, июнь 2026):

#	Компания	Страна	Token/нед	Доля
1	DeepSeek	Китай	5,13T	17,6%
2	Anthropic	США	4,34T	14,8%
3	Google	США	3,66T	12,5%
4	OpenAI	США	2,46T	8,4%
5	Xiaomi	Китай	2,42T	8,3%
6	MiniMax	Китай	2,37T	8,1%
7	Tencent	Китай	2,36T	8,1%
8	Alibaba Qwen	Китай	1,26T	4,3%

Китайские вендоры в Top-8 дают суммарно около 46 процентов; с Moonshot и остальными developer traffic по китайским моделям уже 60%+.

По моделям (суточный объём Token, Top 10):

#	Модель	Вендор	Token/день
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

Выбор по MMLU: lab scores и wallet votes часто inverse correlation — месячный bill не совпадает с ожиданиями.

Игнор июньских structural events: delist Fable 5, double IPO noise, China share >60% — всё три меняют routing logic.

Путать volume и quality: DeepSeek #1 по traffic не значит beat Opus 4.8 по capability ceiling.

Single-model religion: hardcoded provider после Q3 release wave быстро становится tech debt.

API online, host offline: закрыл lid — agent pipeline dead, никакой ranking не спасёт runtime.

US-модели: с 70 до 30 процентов за год — это economics, не hype

Chart, который цитировал Bloomberg, всё объясняет:

Период	Доля US-моделей (Google + OpenAI + Anthropic)
Июнь 2025	~ 70%
Июнь 2026	~ 30%

Куда делись 40 процентных пунктов? В китайские модели. Это не «патриотический» трафик — аудитория OpenRouter global: US, EU, India. Выбирают DeepSeek, Xiaomi, MiniMax потому что дёшево, быстро, хватает для задачи.

«Claude на код — ~10 баксов в час. DeepSeek — меньше 50 центов.» — dev из San Diego, оригинал

Это не quality story, это economics story. Dev из Dallas описывает stack: «Hard tasks — $500/мес Claude + ChatGPT; 90% routine coding и speech через MiniMax + Kimi + MiMo — ~$200/мес.» Route by complexity, optimize cost — default playbook 2026.

#1 по volume ≠ #1 по quality: Opus 4.8, Fable 5 и три китайских lever

Quality ceiling: Claude Opus 4.8 всё ещё #1 overall (Artificial Analysis Intelligence Index, конец мая 2026):

Модель	Quality index	SWE-bench Pro	Заметка
Claude Opus 4.8	61,4 (#1)	69,2%	Long context + agents
GPT-5.5	59–60	63,1%	Ecosystem, tool calls
Gemini 3.1 Pro	57	—	Hardest reasoning
Qwen 3.7 Max	57	—	CN closed flagship
Claude Sonnet 4.6	—	80,8% (SWE-bench Verified)	Writing, instruction follow

Инженер прогнал 20 tasks: Claude Opus 4.8 взял 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4. На long context Opus просто stomps.

Claude Fable 5 брал full quality score (100/100), SWE-bench Verified ~ 95%, но mid-June 2026 delisted globally из-за export controls. Status TBD. Moral: US frontier по raw capability может быть ahead — accessibility стала новой переменной.

Volume king: китайские модели рулят routine через price/performance, три lever:

Price: MiniMax M3 API — $0.60/M input token, примерно 1/8 от Claude Opus 4.8 ($5.00/M).

Good enough: daily coding, completion, translate, summarize — 80–90% top-tier quality.

Open weights: DeepSeek V4, MiniMax M3 — self-host, privacy concerns off the table.

Use case	Модель	Почему
Hard code / Agent	Claude Opus 4.8	Overall #1, long context beast
Daily coding assist	DeepSeek V4 Flash / MiMo-V2.5	Insane $/token, fast
Max API bang-for-buck	MiniMax M3	$0.60/M, open weights, self-host
Long context	Kimi K2.6 (1M context)	Mega window, fair price
Google stack	Gemini 3.5 Flash	Native Workspace
Realtime web search	Grok 4.3	Live X/Twitter feed
Local self-host	GLM 5.2 / Kimi K2.6	Top open weights
Image gen	ChatGPT Images 2.0	Best text-in-image
General chat UX	GPT-5.5	52.5% less hallucination vs GPT-5.3, mature ecosystem

Шесть шагов к model-agnostic AI coding workflow

Tier routing by complexity: hardest 5% → Claude Opus 4.8 / GPT-5.5; routine 95% → DeepSeek V4 Flash, MiMo-V2.5 или MiniMax M3.

OpenRouter как единый gateway: weekly check openrouter.ai/rankings, no hardcoded model ID.

Billing circuit breaker + daily cap: threshold = $/M × daily volume; agent batch на cheap route по умолчанию, heavy refactor → fallback Opus.

Watch Q3 release window: GPT-6, Claude Opus 5, Gemini 4, DeepSeek V5 могут приземлиться за 6 недель с Aug-Sep — routing matrix нужны swap slots.

Enterprise compliance отдельно: China models растут у indie devs, но Fortune 500 procurement упирается в data security и US Congress oversight — compliance = ceiling.

Provision 7x24 agent host: Cursor, Claude Code, OpenClaw с ноутбука на dedicated cloud Mac: launchd always-on, Keychain для multi API key. См. цены и центр помощи.

2026 — год, когда agents переходят из lab в prod. По Anthropic AI Agent Status Report 2026 почти 44% Claude API calls — math и CS tasks. Во втором полугодии побеждает тот, у кого agent stack стабилен.

Прогноз H2: Q3 model dump и пять макротрендов

Confirmed / high-confidence (Q3 2026):

Модель	Вендор	ETA	Highlight
GPT-6	OpenAI	Aug-Sep 2026	Longer context (rumor 1.5M tokens), stronger agents
Claude Opus 5	Anthropic	~Sep 2026	Successor Opus 4.8, long-horizon agents
Gemini 4	Google	Q3 2026	Multimodal++, video + audio
DeepSeek V5	DeepSeek	Q3 2026	Open weights, 1T+ params
Grok 4.3+	xAI	Q3 2026	1M context, realtime web
GLM 5.2	Z.ai	shipped	Top open weights, strong coding

Пять макротрендов:

Competition axis → «best for this scenario»: five labs, 90-day window — no single «best model». Closed frontier на hardest 5%, CN open weights на remaining 95% daily volume.

China share растёт, enterprise compliance — cap: indie devs возможно 70%+ OpenRouter traffic; Fortune 500 вряд ли >30%.

Agents — real battlefield: от benchmark scores к «50-step agent workflow runs reliably».

IPO pressure reshapes pricing: OpenAI и Anthropic signal IPO intent в June 2026 — public-market pressure ускорит price war с CN models.

Local model breakthrough: к 2027 local LLM на consumer GPU (32GB RAM) может пробить SWE-bench 80% coding bar.

Note: data from OpenRouter live traffic, Artificial Analysis, SWE-bench Pro; as of 2026-07-01. Fresh rankings: openrouter.ai/rankings.

Core story: margins на model layer сжимаются fast. DeepSeek в early 2025 показал — frontier quality не требует frontier compute. Xiaomi, Tencent, MiniMax, Moonshot выбили base pricing в пол. US vendors split: OpenAI → ecosystem play; Anthropic → quality moat; Google → speed + multimodal (Gemini Flash — closed-source value pick). Middle tier «decent but expensive» исчезает.

Pure API routing не заменяет agent host: laptop lid down, export controls delist flagship, local open-weights deploy требует 96GB+ unified memory — три path, три hidden cost. Для 7x24 stable multi-model agent pipelines с hot-swap OpenRouter routes KVMNODE dedicated cloud Mac Mini обычно optimal: native Apple Silicon toolchain, flexible day/week/month billing. Цены, заказ: оформить.

Назад к блогу Арендовать