Зачем в 2026 смотреть OpenRouter, а не только MMLU
OpenRouter агрегирует сотни моделей Anthropic, Google, DeepSeek, Tencent, Moonshot, NVIDIA и других в одном API. Рейтинг сортирует по недавнему реальному объёму Token: кого разработчики платно маршрутизируют снова и снова. MMLU и HumanEval — разовый замер в лаборатории; здесь — голос кошелька в продакшене. К середине 2026 разрыв растёт: в пресс-релизах — диалог, в топе вызовов — агентный код, tool calling, RAG с контекстом до 1M, где решают цена за миллион Token и задержка.
По статистике OpenRouter и мониторингу сообщества (июнь 2026, скриншоты пользователей) видны пять сигналов: китайские open-source занимают половину Top 10 с ростом в сотни процентов; 1M Token контекст стал нормой; MoE вытеснил плотные гиганты; полностью бесплатные Agent-модели (Owl Alpha, Nemotron 3 Super free) уводят студентов и соло-разработчиков; мультимодальность у Gemini и Claude в enterprise. Бюджет только на один закрытый флагман как в 2024 — двойной проигрыш в июне: счёт API и ночные агенты.
Только бенчмарки: высокий SWE-bench не предсказывает вашу кривую затрат при частых малых задачах и чтении целых репозиториев.
Культ одной модели: запрет смены маршрута — код на Sonnet, батч на той же цене, счёт взлетает.
Комплаенс бесплатного слоя: Stealth вроде Owl Alpha может хранить промпты — утечка фрагментов repo через ошибочный маршрут.
API онлайн, хост офлайн: закрытый ноутбук рвёт OpenClaw / Claude Code — рейтинг не восстановит runtime.
Иллюзия 200K: один ход агента забивает diff, логи и ответы инструментов — нужен 1M или кэш.
Мы используем Top 10 как компас маршрутизации, не как ответ «одна модель на всё». «Сильнейшая» зависит от профиля: тексты, код уровня issue, 12-часовой swarm, on-prem. Ежеквартально сверяйте дашборд OpenRouter с внутренними счетами: 80 % трафика на DeepSeek V4 Flash при закупке только Claude — ошибка закупок и инженерии.
Для регулируемых данных фиксируйте трансграничные потоки, роль OpenRouter и субподрядчиков, whitelist моделей в договорах с клиентами. Рейтинг показывает, за что платят разработчики в мире — не что разрешено у вас.
Top 10 OpenRouter, июнь 2026: объём, тренд, позиция
Таблица по скриншотам OpenRouter Rankings (июнь 2026) и документации вендоров. Token — оценка платформы; тренд — к прошлому периоду. Структура — китайский MoE впереди, Claude premium, Google multimodal — держится в первой половине 2026.
| Место | Модель | Вендор | Объём (ок.) | Тренд | Позиция |
|---|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 10.9T | 995% | 1M ctx · MoE 284B/13B act · Agent/API цена |
| 2 | Hy3 Preview | Tencent | 10.7T | >999% | OSS MoE · Agent/STEM · +40% эффективность |
| 3 | Claude Opus 4.7 | Anthropic | 7.48T | 197% | флагман · vision · длинные агенты |
| 4 | Claude Sonnet 4.6 | Anthropic | 7.45T | 34% | прод · ~1.7× дешевле Opus |
| 5 | Owl Alpha | OpenRouter | 5.03T | >999% | $0 · 1.05M ctx · Agent |
| 6 | Gemini 3 Flash Preview | 4.6T | 3% | мультимодал · низкая задержка · SWE-bench ~78% | |
| 7 | DeepSeek V4 Pro | DeepSeek | 4.54T | 739% | MoE 1.6T · сложный код/рассуждение |
| 8 | DeepSeek V3.2 | DeepSeek | 4.31T | -14% | прошлое поколение · уступает V4 |
| 9 | Kimi K2.6 | Moonshot | 3.72T | 1% | 1T MoE · Agent Swarm · OSS |
| 10 | Nemotron 3 Super (free) | NVIDIA | 2.65T | 3% | бесплатный OSS · Mamba+Transformer |
DeepSeek V4 Flash лидирует: на 1M контекста в материалах DeepSeek FLOPs на Token ~10% от V3.2, KV ~7%, плюс низкие цены API — дефолт в Cursor, OpenClaw, OpenCode для «много repo + частые tools». Hy3 Preview (Hunyuan 3, 295B / ~21B active) для private cloud и STEM, SWE-bench Verified ~74.4%.
Закрытые западные модели на месте: Claude Opus 4.7 для тяжёлой инженерии и vision; Gemini 3 Flash для экосистемы Google. Owl Alpha и Nemotron 3 Super (free) — прототип бесплатно, качество платно; логика «коммутатор моделей» OpenRouter.
Рейтинг отвечает «что используют все», не «что должны использовать только вы». Продакшен — слоистая маршрутизация.
Шесть осей и шесть трендов 2026
Шкала 1–5 (относительно): быт, код, длинные тексты, рассуждение, мультимодал, агент. 2–3 кандидата, затем A/B на OpenRouter.
| Модель | Быт | Код | Длинный | Рассужд. | MM | Agent |
|---|---|---|---|---|---|---|
| DeepSeek V4 Flash | 5 | 5 | 5 | 5 | — | 5 |
| Hy3 Preview | 4 | 5 | 5 | 5 | — | 5 |
| Claude Opus 4.7 | 4 | 5 | 5 | 5 | 5 | 5 |
| Claude Sonnet 4.6 | 5 | 4 | 5 | 4 | 4 | 4 |
| Owl Alpha | 3 | 4 | 4 | 4 | — | 5 |
| Gemini 3 Flash | 5 | 5 | 5 | 4 | 5 | 5 |
| Kimi K2.6 | 4 | 5 | 4 | 4 | 4 | 5 |
| Nemotron 3 Super | 4 | 4 | 5 | 4 | — | 5 |
Тренд 1 — 1M Token стандарт: весь repo и длинные договоры в один промпт; RAG уступает «засунуть целиком»; KV и канал давят на MoE и скидки кэша.
Тренд 2 — китайский OSS глобально: DeepSeek (три места), Hy3, Kimi — рост >700%. MIT/Apache упрощают self-host + OpenRouter.
Тренд 3 — метрики агентов: SWE-bench Verified, Terminal-Bench 2.0; Kimi K2.6 Agent Swarm (~300 субагентов, 4000 шагов) — ось «оркестрация».
Тренд 4 — MoE везде: Nemotron Mamba + Transformer, ~2.2× throughput vs класс 120B. Сумма параметров ≠ цена inference.
Тренд 5 — бесплатное меняет цены: Owl Alpha $0/$0; Nemotron self-host. Closed Source отвечает free tier — часто ценой данных.
Тренд 6 — мультимодал обязателен: Gemini картинка/звук/видео/PDF; Opus high-res vision. Чистый текст смещается в OCR и UI-скриншотах.
Заметка: локальный ds4 для DeepSeek V4 Flash дополняет облачный маршрут: счёт API vs данные на машине 96GB+.
Шесть шагов: профиль задач, маршрутизация, cloud Mac 7×24
Профиль: интерактивный код, batch-сводки, агент >30 мин, мультимодал, PII/исходники — своя модель и политика данных.
Матрица: по умолчанию DeepSeek V4 Flash; тяжёлый рефакторинг Opus 4.7; мультимодал Gemini 3 Flash; прототип Owl Alpha — поле model или switch в приложении.
Бюджет и circuit breaker: цена за млн Token × суточный объём; дневной потолок, лимиты ключа; Think/Max отдельно.
Чувствительные данные: не гонять клиентский код через Stealth-free; прод: enterprise или self-host Hy3/Nemotron; маскирование логов и регион в ADR.
Оркестрация: Kimi Swarm / OpenClaw: таймаут tools, retry, fallback Sonnet или V4 Flash при «потере».
Хост 7×24: перенести Cursor, Claude Code, OpenClaw на выделенный cloud Mac: launchd, SSH, Keychain. цены, центр помощи для M4 / M4 Pro / RAM.
Чаще пропускают шаги 4 и 6 — утечка через бесплатные модели и «API верный, агент ночью мёртв». OpenRouter даёт модели, не надёжность runtime; здесь сходится аренда cloud Mac.
Цифры для цитирования, цены, выбор cloud Mac KVMNODE
Эффективность DeepSeek V4 Flash: 1M ctx: FLOPs ~10% от V3.2, KV ~7%.
Agent-код: Gemini 3 Flash SWE-bench ~78%; Hy3 ~74.4%, Terminal-Bench 2.0 ~54.4% — не только MMLU.
Цены API (проверять live): V4 Flash ~$0.10/$0.40 за млн; Opus 4.7 $5/$25; Sonnet $3/$15; Owl $0/$0; Gemini 3 Flash $0.50/$3.00 — разница с Opus на порядок возможна.
| Среда | Multi-model API + Agent | Слабость | KVMNODE cloud Mac |
|---|---|---|---|
| Локальный MacBook | быстрый старт; сон рвёт | нет 7×24 | слаб для prod-агентов |
| Только Linux VPS | дёшево CLI | нет Xcode/Metal | слабый iOS CI |
| cloud Mac Mini M4 | launchd + ключи OpenRouter | план аренды/снапшотов | силён для Agent + Apple |
Только бесплатная модель — стена качества и compliance. Только Opus — счёт взрывается на частых agent-loop. Только ноутбук — 7×24 невозможен. Командам с Apple Silicon, SSH-передачей и слоистым OpenRouter для Cursor / Claude Code / OpenClaw подходит выделенный Mac Mini M4 / M4 Pro KVMNODE: ЦОД без сна, гибкая аренда, согласовано с постоянным OpenClaw и шестью регионами. цены, оформить заказ — перенести стек с дивана на этой неделе.