Почему недельный billing сильнее бенчмарков — шесть модулей
OpenRouter публикует недельные объёмы Token по моделям и регионам — агрегация реальных API-вызовов, а не пресс-релизов. В отличие от MMLU или HumanEval эта серия показывает, за что команды платят под нагрузкой: циклы агента, tool calls, контекст на миллионы Token и параллельный CI. Календарная неделя достаточно коротка для momentum и достаточно длинна против дневного шума.
Середина 2026 делит рынок: те, кто выбирает модель по лабораторному скору, и те, кто каждый понедельник сравнивает неделю OpenRouter со своим счётом. Вторая группа быстрее переводит bulk с Opus на V4 Flash, когда agent-loops ломают dollar-кривую — без потери качества на рутине.
Голос кошелька vs лаборатория: каждый маршрутизированный Token стоит денег или квоты. Рейтинг отражает прод, а не один prompt.
Недельная дельта = momentum: +7.4% WoW сигнализирует рост agent-adoption — месячные графики скрывают ускорение.
Доля Token ≠ доля доллара: Anthropic 12% Token vs 46% выручки — premium-цена за миллион Token доминирует в бюджете.
Региональные акценты: Китай 9.223T vs США 4.93T — маршрутизация, latency и compliance должны следовать географии.
Agent-loops раздувают объём: swarm на 40 шагов даёт больше Token, чем чат — недельный рейтинг favor дешёвый output.
Free-tier искажает: Owl Alpha и $0-маршруты в рейтинге, но с риском данных — разделяйте prototype и prod.
Итог: счёт не врёт, потому что измеряет альтернативную стоимость. Игнорировать это — оптимизировать не те модели и удивляться OpEx при «хорошем» MMLU.
28.9T глобально: Китай–США и рост +7.4%
Неделя 18–24 мая 2026 дала 28.9T Token worldwide — рост 7.4% к предыдущей неделе. Это не сезонный выброс: Cursor Background Agents, Claude Code и OpenClaw Gateway работают всё чаще непрерывно; каждая ночь генерирует Token без ввода человека.
Китай — 9.223T (~32% global). Драйверы: DeepSeek V4 Flash, Tencent Hy3, Kimi, низкие цены и сильная локальная dev-база. США — 4.93T (~17%): Claude Opus/Sonnet для enterprise-refactor, Gemini для Google-multimodal, legacy GPT. Европа и остальной мир делят остаток — важно для transfer compliance, так как sub-provider OpenRouter часто US или APAC.
| Регион | Token за неделю | Доля global | Типичные workloads |
|---|---|---|---|
| Global | 28.9T | 100% | Agent coding, batch summary, RAG |
| Китай | 9.223T | ~32% | DeepSeek/Hy3 default, OSS self-host + API |
| США | 4.93T | ~17% | Claude premium, Gemini multimodal, legacy GPT |
| Остальное / EU | ~14.7T | ~51% | Смешанная маршрутизация, compliance-sensitive |
Для Tech Lead: один global default редко подходит. Команды с EU-данными клиентов должны еженедельно проверять, отражает ли политика маршрутизации реальные веса Китай–США — или bulk идёт через premium US без осознанности. +7.4% WoW — ранний сигнал для budget review: CapEx Mac и OpEx API не масштабируются линейно с параллельными агентами.
На практике: зафиксируйте в ADR три региональных bucket (CN / US / rest) и сравнивайте с экспортом OpenRouter каждую неделю. Если ваш счёт показывает 80% US premium, а global ranking — 32% китайского объёма, вы маршрутизируете дороже рынка; это рычаг экономии без потери качества на рутинных agent-задачах.
Рост Token без еженедельной дисциплины маршрутизации — OpEx-бомба замедленного действия; счёт приходит раньше обновления бенчмарка.
Top 10 недели и парадокс Anthropic
Рейтинг моделей 18–24 мая 2026 (недельная статистика OpenRouter). Цифры агрегированы платформой; места сдвигаются, форма — китайский MoE впереди, Claude в premium-нише, free-prototype — стабильна с Q2 2026.
| Место | Модель | Вендор | Token за неделю | Роль |
|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 3.43T | Default agent/coding, 1M ctx, низкий $/M |
| 2 | Hy3 | Tencent | 3.07T | OSS MoE, STEM/agent, self-host + API |
| 3 | Claude Sonnet 4.6 | Anthropic | 1.35T | Balanced premium, длинные refactor |
| 4 | Claude Opus 4.7 | Anthropic | 1.08T | Hard reasoning, vision-heavy |
| 5 | Owl Alpha | OpenRouter | 0.92T | $0 prototype, agent-tuned, stealth-риск |
| 6 | Gemini 3 Flash | 0.81T | Multimodal, Google stack | |
| 7 | DeepSeek V3.2 | DeepSeek | 0.76T | Legacy route, миграция на V4 Flash |
| 8 | Kimi K2.6 | Moonshot | 0.68T | Agent swarm, длинная orchestration |
| 9 | Nemotron 3 Super | NVIDIA | 0.54T | Free/self-host, Mamba-MoE hybrid |
| 10 | GPT-4o | OpenAI | 0.47T | Legacy enterprise, постепенная замена |
DeepSeek суммарно: 5.74T (V4 Flash + V3.2 + варианты) — почти 20% global weekly volume одного вендора. Cursor, OpenClaw и OpenCode ставят V4 Flash default: при миллионах input Token в день дешёвый output важнее marginal MMLU.
Парадокс Anthropic: лишь 12% Token, но 46% доллара на OpenRouter. Sonnet и Opus стоят кратно дороже V4 Flash — команды платят premium за тяжёлые refactor и sensitive flows, bulk ведут через DeepSeek. Читать только Token — недооценить выручку Anthropic; только dollar — не увидеть, что дешёвые модели тянут +7.4%.
Stealth-free (Owl Alpha) и US premium могут обрабатывать prompts вне вашего региона. Документируйте договоры с OpenRouter и sub-provider; transfer и retention — в еженедельный routing review, не в сноску legal.
Hy3 с 3.07T на втором месте подтверждает тренд китайского OSS MoE: STEM-agents и self-host параллельно API. Kimi K2.6 и Nemotron 3 Super закрывают swarm и бесплатные эксперименты, не доминируя в dollar-картине.
Шесть шагов: трекинг недели OpenRouter и корректировка маршрута
Зафиксировать baseline: каждый понедельник экспорт недельной статистики OpenRouter; global, регион, Top 10 и ваш счёт — расхождение >15% расследовать.
Разделить Token и dollar: input/output price × недельный объём; парадокс Anthropic виден во внутреннем dashboard.
Региональный fit: china-heavy модели для bulk; US premium для PII/refactor; EU self-host при sensitive data.
Обновить routing matrix: default V4 Flash; Sonnet для hard PR; Hy3 для STEM swarms; Owl только sandbox — через поле model OpenRouter.
Circuit breaker: дневной cap на key, alert при WoW +20%; Think/Max отдельно — agent-loops эскалируют быстро.
Provision 7×24 host: weekly review бесполезен, если agent-host спит. Cursor, Claude Code, OpenClaw на выделенном cloud Mac с launchd и Keychain. Цены аренды, Центр помощи, Оформить заказ.
Типичная ошибка: шаги 1–5 в spreadsheet, шаг 6 на ноутбуке lead-разработчика. OpenRouter оптимизирует cost модели; runtime reliability — ваша infra. Синхронизация каждую неделю отвечает на +7.4% маршрутизацией, а не panic-buy.
Security-командам стоит проверить: какие API-keys лежали на BYOD; не передавались ли prod-secrets agent-tools. Еженедельная смена маршрута — момент относиться к CLI-agents как к CI-secrets, с учётом compliance при персональных данных в prompts.
Три цифры для цитирования и cloud Mac KVMNODE
Global WoW (OpenRouter, 18–24 мая 2026): 28.9T Token, +7.4% — agent-adoption ускоряется; квартального бюджета часто мало.
Недельная доля DeepSeek: 5.74T total (~20% global) — V4 Flash 3.43T лидирует один; дешёвый MoE OSS доминирует объём.
Split Anthropic Token/dollar: 12% Token, 46% dollar — premium price тянет выручку; bulk должен оставаться на дешёвых моделях.
| Runtime | Еженедельный трекинг OpenRouter | Слабость | Cloud Mac KVMNODE |
|---|---|---|---|
| Локальный MacBook | быстрый dashboard-check | sleep останавливает agent ночью | слабо для 7×24 + review routine |
| Linux VPS | дёшево для CLI-only | нет Xcode/Metal/Keychain | слабо для Apple-stack agents |
| Cloud Mac Mini M4 | launchd + OpenRouter keys + snapshot | планирование аренды | сильно для agent + weekly CI |
Только рейтинг — пропустить dollar-парадокс. Только Opus — счёт взорвётся при +7.4% WoW. Только ноутбук — weekly discipline ломается. Команды с Apple Silicon, SSH и tiered OpenRouter для Cursor, Claude Code, OpenClaw выигрывают от выделенного Mac Mini M4/M4 Pro KVMNODE: DC без sleep, гибкая аренда, согласовано с OpenClaw 24/7 и Agent Skills.
Закупки: один senior-day на debugging из-за спящего host часто дороже месяца M4. API-dollar и аренда Mac вместе — неделя 18–24 мая доказывает: Token растут быстрее бенчмарков; infra должна успевать.
Старт на этой неделе: snapshot Top 10 OpenRouter рядом со своим счётом, routing matrix в Git, cloud Mac под agent-host. Через четыре недели видно, следует ли ваша Token-кривая рынку (+7.4% WoW) или внутренняя неэффективность раздувает cost — data-driven, а не «любимая модель».