Почему недельный рейтинг OpenRouter надёжнее MMLU?

Он измеряет оплаченные API Token за календарную неделю — циклы агента, tool calls, контекст на миллионы. Бенчмарки — одиночные промпты без счёта.

Почему у Anthropic 12% Token, но 46% доллара?

Claude Opus и Sonnet стоят на порядок дороже DeepSeek V4 Flash за миллион Token. Доля Token недооценивает premium-выручку; бюджету нужны обе метрики.

Нужен ли cloud Mac при маршрутизации через OpenRouter?

OpenRouter даёт модели; Cursor, Claude Code и OpenClaw требуют хост 7×24, Keychain и Apple toolchain. Еженедельный review на спящем ноутбуке проваливается.

OpenRouter: недельный рейтинг по Token

Если каждую неделю вы переключаете Claude, DeepSeek и Hy3, но смотрите только скриншоты MMLU, вы упускаете главное: billing-данные OpenRouter за неделю 18–24 мая 2026. Глобально 28.9T Token (+7.4%), Китай 9.223T, США 4.93T; лидеры: DeepSeek V4 Flash 3.43T, Hy3 3.07T, Claude Sonnet 4.6 1.35T; DeepSeek суммарно 5.74T, Anthropic 12% Token, но 46% доллара. Шесть модулей, таблица Top 10, шесть шагов еженедельного трекинга, три цифры для цитирования. Дополняет рейтинг июня и ds4 локально; для Agent 7×24 — cloud Mac KVMNODE.

Почему недельный billing сильнее бенчмарков — шесть модулей

OpenRouter публикует недельные объёмы Token по моделям и регионам — агрегация реальных API-вызовов, а не пресс-релизов. В отличие от MMLU или HumanEval эта серия показывает, за что команды платят под нагрузкой: циклы агента, tool calls, контекст на миллионы Token и параллельный CI. Календарная неделя достаточно коротка для momentum и достаточно длинна против дневного шума.

Середина 2026 делит рынок: те, кто выбирает модель по лабораторному скору, и те, кто каждый понедельник сравнивает неделю OpenRouter со своим счётом. Вторая группа быстрее переводит bulk с Opus на V4 Flash, когда agent-loops ломают dollar-кривую — без потери качества на рутине.

Голос кошелька vs лаборатория: каждый маршрутизированный Token стоит денег или квоты. Рейтинг отражает прод, а не один prompt.

Недельная дельта = momentum: +7.4% WoW сигнализирует рост agent-adoption — месячные графики скрывают ускорение.

Доля Token ≠ доля доллара: Anthropic 12% Token vs 46% выручки — premium-цена за миллион Token доминирует в бюджете.

Региональные акценты: Китай 9.223T vs США 4.93T — маршрутизация, latency и compliance должны следовать географии.

Agent-loops раздувают объём: swarm на 40 шагов даёт больше Token, чем чат — недельный рейтинг favor дешёвый output.

Free-tier искажает: Owl Alpha и $0-маршруты в рейтинге, но с риском данных — разделяйте prototype и prod.

Итог: счёт не врёт, потому что измеряет альтернативную стоимость. Игнорировать это — оптимизировать не те модели и удивляться OpEx при «хорошем» MMLU.

28.9T глобально: Китай–США и рост +7.4%

Неделя 18–24 мая 2026 дала 28.9T Token worldwide — рост 7.4% к предыдущей неделе. Это не сезонный выброс: Cursor Background Agents, Claude Code и OpenClaw Gateway работают всё чаще непрерывно; каждая ночь генерирует Token без ввода человека.

Китай — 9.223T (~32% global). Драйверы: DeepSeek V4 Flash, Tencent Hy3, Kimi, низкие цены и сильная локальная dev-база. США — 4.93T (~17%): Claude Opus/Sonnet для enterprise-refactor, Gemini для Google-multimodal, legacy GPT. Европа и остальной мир делят остаток — важно для transfer compliance, так как sub-provider OpenRouter часто US или APAC.

Регион	Token за неделю	Доля global	Типичные workloads
Global	28.9T	100%	Agent coding, batch summary, RAG
Китай	9.223T	~32%	DeepSeek/Hy3 default, OSS self-host + API
США	4.93T	~17%	Claude premium, Gemini multimodal, legacy GPT
Остальное / EU	~14.7T	~51%	Смешанная маршрутизация, compliance-sensitive

Для Tech Lead: один global default редко подходит. Команды с EU-данными клиентов должны еженедельно проверять, отражает ли политика маршрутизации реальные веса Китай–США — или bulk идёт через premium US без осознанности. +7.4% WoW — ранний сигнал для budget review: CapEx Mac и OpEx API не масштабируются линейно с параллельными агентами.

На практике: зафиксируйте в ADR три региональных bucket (CN / US / rest) и сравнивайте с экспортом OpenRouter каждую неделю. Если ваш счёт показывает 80% US premium, а global ranking — 32% китайского объёма, вы маршрутизируете дороже рынка; это рычаг экономии без потери качества на рутинных agent-задачах.

Рост Token без еженедельной дисциплины маршрутизации — OpEx-бомба замедленного действия; счёт приходит раньше обновления бенчмарка.

Top 10 недели и парадокс Anthropic

Рейтинг моделей 18–24 мая 2026 (недельная статистика OpenRouter). Цифры агрегированы платформой; места сдвигаются, форма — китайский MoE впереди, Claude в premium-нише, free-prototype — стабильна с Q2 2026.

Место	Модель	Вендор	Token за неделю	Роль
1	DeepSeek V4 Flash	DeepSeek	3.43T	Default agent/coding, 1M ctx, низкий $/M
2	Hy3	Tencent	3.07T	OSS MoE, STEM/agent, self-host + API
3	Claude Sonnet 4.6	Anthropic	1.35T	Balanced premium, длинные refactor
4	Claude Opus 4.7	Anthropic	1.08T	Hard reasoning, vision-heavy
5	Owl Alpha	OpenRouter	0.92T	$0 prototype, agent-tuned, stealth-риск
6	Gemini 3 Flash	Google	0.81T	Multimodal, Google stack
7	DeepSeek V3.2	DeepSeek	0.76T	Legacy route, миграция на V4 Flash
8	Kimi K2.6	Moonshot	0.68T	Agent swarm, длинная orchestration
9	Nemotron 3 Super	NVIDIA	0.54T	Free/self-host, Mamba-MoE hybrid
10	GPT-4o	OpenAI	0.47T	Legacy enterprise, постепенная замена

DeepSeek суммарно: 5.74T (V4 Flash + V3.2 + варианты) — почти 20% global weekly volume одного вендора. Cursor, OpenClaw и OpenCode ставят V4 Flash default: при миллионах input Token в день дешёвый output важнее marginal MMLU.

Парадокс Anthropic: лишь 12% Token, но 46% доллара на OpenRouter. Sonnet и Opus стоят кратно дороже V4 Flash — команды платят premium за тяжёлые refactor и sensitive flows, bulk ведут через DeepSeek. Читать только Token — недооценить выручку Anthropic; только dollar — не увидеть, что дешёвые модели тянут +7.4%.

Stealth-free (Owl Alpha) и US premium могут обрабатывать prompts вне вашего региона. Документируйте договоры с OpenRouter и sub-provider; transfer и retention — в еженедельный routing review, не в сноску legal.

Hy3 с 3.07T на втором месте подтверждает тренд китайского OSS MoE: STEM-agents и self-host параллельно API. Kimi K2.6 и Nemotron 3 Super закрывают swarm и бесплатные эксперименты, не доминируя в dollar-картине.

Шесть шагов: трекинг недели OpenRouter и корректировка маршрута

Зафиксировать baseline: каждый понедельник экспорт недельной статистики OpenRouter; global, регион, Top 10 и ваш счёт — расхождение >15% расследовать.

Разделить Token и dollar: input/output price × недельный объём; парадокс Anthropic виден во внутреннем dashboard.

Региональный fit: china-heavy модели для bulk; US premium для PII/refactor; EU self-host при sensitive data.

Обновить routing matrix: default V4 Flash; Sonnet для hard PR; Hy3 для STEM swarms; Owl только sandbox — через поле model OpenRouter.

Circuit breaker: дневной cap на key, alert при WoW +20%; Think/Max отдельно — agent-loops эскалируют быстро.

Provision 7×24 host: weekly review бесполезен, если agent-host спит. Cursor, Claude Code, OpenClaw на выделенном cloud Mac с launchd и Keychain. Цены аренды, Центр помощи, Оформить заказ.

Типичная ошибка: шаги 1–5 в spreadsheet, шаг 6 на ноутбуке lead-разработчика. OpenRouter оптимизирует cost модели; runtime reliability — ваша infra. Синхронизация каждую неделю отвечает на +7.4% маршрутизацией, а не panic-buy.

Security-командам стоит проверить: какие API-keys лежали на BYOD; не передавались ли prod-secrets agent-tools. Еженедельная смена маршрута — момент относиться к CLI-agents как к CI-secrets, с учётом compliance при персональных данных в prompts.

Три цифры для цитирования и cloud Mac KVMNODE

Global WoW (OpenRouter, 18–24 мая 2026): 28.9T Token, +7.4% — agent-adoption ускоряется; квартального бюджета часто мало.

Недельная доля DeepSeek: 5.74T total (~20% global) — V4 Flash 3.43T лидирует один; дешёвый MoE OSS доминирует объём.

Split Anthropic Token/dollar: 12% Token, 46% dollar — premium price тянет выручку; bulk должен оставаться на дешёвых моделях.

Runtime	Еженедельный трекинг OpenRouter	Слабость	Cloud Mac KVMNODE
Локальный MacBook	быстрый dashboard-check	sleep останавливает agent ночью	слабо для 7×24 + review routine
Linux VPS	дёшево для CLI-only	нет Xcode/Metal/Keychain	слабо для Apple-stack agents
Cloud Mac Mini M4	launchd + OpenRouter keys + snapshot	планирование аренды	сильно для agent + weekly CI

Только рейтинг — пропустить dollar-парадокс. Только Opus — счёт взорвётся при +7.4% WoW. Только ноутбук — weekly discipline ломается. Команды с Apple Silicon, SSH и tiered OpenRouter для Cursor, Claude Code, OpenClaw выигрывают от выделенного Mac Mini M4/M4 Pro KVMNODE: DC без sleep, гибкая аренда, согласовано с OpenClaw 24/7 и Agent Skills.

Закупки: один senior-day на debugging из-за спящего host часто дороже месяца M4. API-dollar и аренда Mac вместе — неделя 18–24 мая доказывает: Token растут быстрее бенчмарков; infra должна успевать.

Старт на этой неделе: snapshot Top 10 OpenRouter рядом со своим счётом, routing matrix в Git, cloud Mac под agent-host. Через четыре недели видно, следует ли ваша Token-кривая рынку (+7.4% WoW) или внутренняя неэффективность раздувает cost — data-driven, а не «любимая модель».

Назад в блог Арендовать сейчас