Если каждую неделю вы переключаете Claude, DeepSeek и Hy3, но смотрите только скриншоты MMLU, вы упускаете главное: billing-данные OpenRouter за неделю 18–24 мая 2026. Глобально 28.9T Token (+7.4%), Китай 9.223T, США 4.93T; лидеры: DeepSeek V4 Flash 3.43T, Hy3 3.07T, Claude Sonnet 4.6 1.35T; DeepSeek суммарно 5.74T, Anthropic 12% Token, но 46% доллара. Шесть модулей, таблица Top 10, шесть шагов еженедельного трекинга, три цифры для цитирования. Дополняет рейтинг июня и ds4 локально; для Agent 7×24 — cloud Mac KVMNODE.
01

Почему недельный billing сильнее бенчмарков — шесть модулей

OpenRouter публикует недельные объёмы Token по моделям и регионам — агрегация реальных API-вызовов, а не пресс-релизов. В отличие от MMLU или HumanEval эта серия показывает, за что команды платят под нагрузкой: циклы агента, tool calls, контекст на миллионы Token и параллельный CI. Календарная неделя достаточно коротка для momentum и достаточно длинна против дневного шума.

Середина 2026 делит рынок: те, кто выбирает модель по лабораторному скору, и те, кто каждый понедельник сравнивает неделю OpenRouter со своим счётом. Вторая группа быстрее переводит bulk с Opus на V4 Flash, когда agent-loops ломают dollar-кривую — без потери качества на рутине.

01

Голос кошелька vs лаборатория: каждый маршрутизированный Token стоит денег или квоты. Рейтинг отражает прод, а не один prompt.

02

Недельная дельта = momentum: +7.4% WoW сигнализирует рост agent-adoption — месячные графики скрывают ускорение.

03

Доля Token ≠ доля доллара: Anthropic 12% Token vs 46% выручки — premium-цена за миллион Token доминирует в бюджете.

04

Региональные акценты: Китай 9.223T vs США 4.93T — маршрутизация, latency и compliance должны следовать географии.

05

Agent-loops раздувают объём: swarm на 40 шагов даёт больше Token, чем чат — недельный рейтинг favor дешёвый output.

06

Free-tier искажает: Owl Alpha и $0-маршруты в рейтинге, но с риском данных — разделяйте prototype и prod.

Итог: счёт не врёт, потому что измеряет альтернативную стоимость. Игнорировать это — оптимизировать не те модели и удивляться OpEx при «хорошем» MMLU.

02

28.9T глобально: Китай–США и рост +7.4%

Неделя 18–24 мая 2026 дала 28.9T Token worldwide — рост 7.4% к предыдущей неделе. Это не сезонный выброс: Cursor Background Agents, Claude Code и OpenClaw Gateway работают всё чаще непрерывно; каждая ночь генерирует Token без ввода человека.

Китай9.223T (~32% global). Драйверы: DeepSeek V4 Flash, Tencent Hy3, Kimi, низкие цены и сильная локальная dev-база. США4.93T (~17%): Claude Opus/Sonnet для enterprise-refactor, Gemini для Google-multimodal, legacy GPT. Европа и остальной мир делят остаток — важно для transfer compliance, так как sub-provider OpenRouter часто US или APAC.

РегионToken за неделюДоля globalТипичные workloads
Global28.9T100%Agent coding, batch summary, RAG
Китай9.223T~32%DeepSeek/Hy3 default, OSS self-host + API
США4.93T~17%Claude premium, Gemini multimodal, legacy GPT
Остальное / EU~14.7T~51%Смешанная маршрутизация, compliance-sensitive

Для Tech Lead: один global default редко подходит. Команды с EU-данными клиентов должны еженедельно проверять, отражает ли политика маршрутизации реальные веса Китай–США — или bulk идёт через premium US без осознанности. +7.4% WoW — ранний сигнал для budget review: CapEx Mac и OpEx API не масштабируются линейно с параллельными агентами.

На практике: зафиксируйте в ADR три региональных bucket (CN / US / rest) и сравнивайте с экспортом OpenRouter каждую неделю. Если ваш счёт показывает 80% US premium, а global ranking — 32% китайского объёма, вы маршрутизируете дороже рынка; это рычаг экономии без потери качества на рутинных agent-задачах.

Рост Token без еженедельной дисциплины маршрутизации — OpEx-бомба замедленного действия; счёт приходит раньше обновления бенчмарка.

03

Top 10 недели и парадокс Anthropic

Рейтинг моделей 18–24 мая 2026 (недельная статистика OpenRouter). Цифры агрегированы платформой; места сдвигаются, форма — китайский MoE впереди, Claude в premium-нише, free-prototype — стабильна с Q2 2026.

МестоМодельВендорToken за неделюРоль
1DeepSeek V4 FlashDeepSeek3.43TDefault agent/coding, 1M ctx, низкий $/M
2Hy3Tencent3.07TOSS MoE, STEM/agent, self-host + API
3Claude Sonnet 4.6Anthropic1.35TBalanced premium, длинные refactor
4Claude Opus 4.7Anthropic1.08THard reasoning, vision-heavy
5Owl AlphaOpenRouter0.92T$0 prototype, agent-tuned, stealth-риск
6Gemini 3 FlashGoogle0.81TMultimodal, Google stack
7DeepSeek V3.2DeepSeek0.76TLegacy route, миграция на V4 Flash
8Kimi K2.6Moonshot0.68TAgent swarm, длинная orchestration
9Nemotron 3 SuperNVIDIA0.54TFree/self-host, Mamba-MoE hybrid
10GPT-4oOpenAI0.47TLegacy enterprise, постепенная замена

DeepSeek суммарно: 5.74T (V4 Flash + V3.2 + варианты) — почти 20% global weekly volume одного вендора. Cursor, OpenClaw и OpenCode ставят V4 Flash default: при миллионах input Token в день дешёвый output важнее marginal MMLU.

Парадокс Anthropic: лишь 12% Token, но 46% доллара на OpenRouter. Sonnet и Opus стоят кратно дороже V4 Flash — команды платят premium за тяжёлые refactor и sensitive flows, bulk ведут через DeepSeek. Читать только Token — недооценить выручку Anthropic; только dollar — не увидеть, что дешёвые модели тянут +7.4%.

Stealth-free (Owl Alpha) и US premium могут обрабатывать prompts вне вашего региона. Документируйте договоры с OpenRouter и sub-provider; transfer и retention — в еженедельный routing review, не в сноску legal.

Hy3 с 3.07T на втором месте подтверждает тренд китайского OSS MoE: STEM-agents и self-host параллельно API. Kimi K2.6 и Nemotron 3 Super закрывают swarm и бесплатные эксперименты, не доминируя в dollar-картине.

04

Шесть шагов: трекинг недели OpenRouter и корректировка маршрута

01

Зафиксировать baseline: каждый понедельник экспорт недельной статистики OpenRouter; global, регион, Top 10 и ваш счёт — расхождение >15% расследовать.

02

Разделить Token и dollar: input/output price × недельный объём; парадокс Anthropic виден во внутреннем dashboard.

03

Региональный fit: china-heavy модели для bulk; US premium для PII/refactor; EU self-host при sensitive data.

04

Обновить routing matrix: default V4 Flash; Sonnet для hard PR; Hy3 для STEM swarms; Owl только sandbox — через поле model OpenRouter.

05

Circuit breaker: дневной cap на key, alert при WoW +20%; Think/Max отдельно — agent-loops эскалируют быстро.

06

Provision 7×24 host: weekly review бесполезен, если agent-host спит. Cursor, Claude Code, OpenClaw на выделенном cloud Mac с launchd и Keychain. Цены аренды, Центр помощи, Оформить заказ.

Типичная ошибка: шаги 1–5 в spreadsheet, шаг 6 на ноутбуке lead-разработчика. OpenRouter оптимизирует cost модели; runtime reliability — ваша infra. Синхронизация каждую неделю отвечает на +7.4% маршрутизацией, а не panic-buy.

Security-командам стоит проверить: какие API-keys лежали на BYOD; не передавались ли prod-secrets agent-tools. Еженедельная смена маршрута — момент относиться к CLI-agents как к CI-secrets, с учётом compliance при персональных данных в prompts.

05

Три цифры для цитирования и cloud Mac KVMNODE

A

Global WoW (OpenRouter, 18–24 мая 2026): 28.9T Token, +7.4% — agent-adoption ускоряется; квартального бюджета часто мало.

B

Недельная доля DeepSeek: 5.74T total (~20% global) — V4 Flash 3.43T лидирует один; дешёвый MoE OSS доминирует объём.

C

Split Anthropic Token/dollar: 12% Token, 46% dollar — premium price тянет выручку; bulk должен оставаться на дешёвых моделях.

RuntimeЕженедельный трекинг OpenRouterСлабостьCloud Mac KVMNODE
Локальный MacBookбыстрый dashboard-checksleep останавливает agent ночьюслабо для 7×24 + review routine
Linux VPSдёшево для CLI-onlyнет Xcode/Metal/Keychainслабо для Apple-stack agents
Cloud Mac Mini M4launchd + OpenRouter keys + snapshotпланирование арендысильно для agent + weekly CI

Только рейтинг — пропустить dollar-парадокс. Только Opus — счёт взорвётся при +7.4% WoW. Только ноутбук — weekly discipline ломается. Команды с Apple Silicon, SSH и tiered OpenRouter для Cursor, Claude Code, OpenClaw выигрывают от выделенного Mac Mini M4/M4 Pro KVMNODE: DC без sleep, гибкая аренда, согласовано с OpenClaw 24/7 и Agent Skills.

Закупки: один senior-day на debugging из-за спящего host часто дороже месяца M4. API-dollar и аренда Mac вместе — неделя 18–24 мая доказывает: Token растут быстрее бенчмарков; infra должна успевать.

Старт на этой неделе: snapshot Top 10 OpenRouter рядом со своим счётом, routing matrix в Git, cloud Mac под agent-host. Через четыре недели видно, следует ли ваша Token-кривая рынку (+7.4% WoW) или внутренняя неэффективность раздувает cost — data-driven, а не «любимая модель».