왜 「청구 데이터는 거짓말하지 않는가」— 주간 랭킹 읽는 법
OpenRouter 주간 Token 랭킹은 개발자가 실제로 API 키로 호출하고 과금한 Token 총량으로 모델을 정렬합니다. MMLU나 SWE-bench 같은 정적 점수와 근본적으로 다릅니다. 벤치마크는 「실험실의 일회 승부」, 주간 랭킹은 「지갑이 선택한 결과」입니다. 2026년 5월 24일 주 글로벌 규모 28.9T Token은 전주 대비 +7.4%로 Agent화가 가속하고 있음을 보여줍니다.
a16z 2026년 분석에서는 벤치마크 상위 모델과 시장 Token 소비량 사이에 역상관이 관찰됩니다. 점수표 1위 모델일수록 실제 라우팅량에서는 후방으로 밀리는 경향입니다. 개발자는 「최고 점수」가 아니라 「태스크당 가성비」「Agent 루프 안정성」「백만 Token 단가」로 고르기 때문입니다. 주간 데이터를 보면 중국발 오픈 MoE(DeepSeek, Hy3)가 양을 지배하고 서구 클로즈드(Anthropic, Google)는 단가로 수익을 가져가는 이중 구조가 분명합니다.
벤치마크 맹신: 리더보드 1위를 모든 태스크 기본값으로 두면 고빈도 Agent 루프에서 청구가 폭발하고 실제 트래픽은 저가 모델로 흐릅니다.
Token량과 달러량 혼동: Anthropic은 Token 점유 약 12%인데도 달러 점유 약 46%. Sonnet을 무분별 기본값으로 두면 월 청구만 부풀어 오릅니다.
주간 변동 무시: Top 10은 매주 바뀝니다. 분기별 벤치 업데이트만으로는 5월 24일 주 Hy3 급등이나 MiniMax 신규 진입을 놓칩니다.
지역 편향: 중국 9.223T와 미국 4.93T 차이는 모델 선호뿐 아니라 규제·가격·자체 호스팅 문화 차이입니다.
API는 맞고 호스트는 틀림: 라우팅은 올바른데 노트북 절전으로 OpenClaw·Claude Code 야간 작업이 멈추면 청구 데이터가 가리키는 최적해가 실행되지 않습니다.
주간 랭킹은 「이번 주 개발자 지갑이 무엇을 선택했는가」의 진실입니다. 아래에서는 5월 24일 주 Top 10과 지역 구조를 분해하고 청구 기반 라우팅 결정으로 연결합니다.
2026년 5월 24일 주 Top 10: Token량과 한 줄 포지션
아래 표는 OpenRouter 주간 랭킹(주간 종료일 2026년 5월 24일) Token 호출량입니다. 전주 대비 순위 변동은 있으나 DeepSeek 계열 3모델 합계 5.74T, 중국 OSS MoE가 양의 중심, Claude Sonnet이 서구 클로즈드 양의 기둥이라는 구조는 분명합니다.
| 순위 | 모델 | 조직 | 주간 Token | 포지션 |
|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 3.43T | Agent/API 가성비 · 1M ctx · MoE |
| 2 | Hy3 Preview | Tencent | 3.07T | OSS MoE · STEM/Agent · 급성장 |
| 3 | Claude Sonnet 4.6 | Anthropic | 1.35T | 프로덕션 주력 · 고단가 · 서구 양의 기둥 |
| 4 | DeepSeek V3.2 | DeepSeek | 1.31T | 전세대 · V4로 분류 중 |
| 5 | Owl Alpha | OpenRouter | 1.15T | $0 라우트 · Agent 프로토 · Stealth 주의 |
| 6 | Gemini 3 Flash | 1.06T | 멀티모달 · 저지연 · 기업 통합 | |
| 7 | DeepSeek V4 Pro | DeepSeek | 1.00T | 플래그십 MoE · 복잡 추론/코드 |
| 8 | MiniMax M2.7 | MiniMax | 806B | 신규 · 중국발 · Agent용 |
| 9 | Grok 4.1 Fast | xAI | 721B | 고속 추론 · X 연동 · 실험용 |
| 10 | Step 3.5 Flash | StepFun | 673B | 경량 Flash · 중국 OSS · 가성비 |
DeepSeek V4 Flash 3.43T는 단독으로 Top 10 합계의 약 12%에 해당하며 1위 단독 지배력을 보여줍니다. Hy3 Preview 3.07T는 Tencent Hunyuan3 OSS MoE 급등으로 자체 호스팅과 OpenRouter 이중 수요를 반영합니다. Claude Sonnet 4.6은 양으로 3위이나 백만 Token 단가가 V4 Flash보다 한 자릿수 이상 높아 달러 기준 Anthropic 전체가 약 46% 점유합니다. Owl Alpha 1.15T는 무료 라우트 프로토타입 수요, MiniMax M2.7과 Step 3.5 Flash는 중국발 신규로 Top 10에 진입했습니다.
주간 Token량은 「누가 쓰이는가」를, 달러 점유는 「누가 버는가」를 보여줍니다. 둘 다 보지 않으면 라우팅이 왜곡됩니다.
지역 구조·DeepSeek 지배·벤치 역상관 6대 트렌드
5월 24일 주 지역별 Token량은 중국 9.223T(글로벌 약 32%), 미국 4.93T(약 17%)입니다. 중국은 DeepSeek·Hy3·MiniMax·StepFun OSS MoE 생태와 자체 호스팅 문화가 Token량을 끌어올립니다. 미국은 Anthropic·Google·xAI 클로즈드 API가 달러 수익의 중심입니다.
DeepSeek 단독(V4 Flash + V3.2 + V4 Pro) 합계 5.74T는 글로벌 28.9T의 약 20%로 단일 벤더 최대 Token 점유입니다. Anthropic은 Token량 약 12%인데 Opus/Sonnet 고단가로 달러 점유 약 46%를 차지합니다. 이 Token/달러 괴리는 팀이 Sonnet을 모든 태스크 기본값으로 두면 「양은 적은데 청구는 최대」 역설을 만듭니다.
| 모델 | 일상 | 코드 | 장문 | 추론 | MM | Agent |
|---|---|---|---|---|---|---|
| DeepSeek V4 Flash | 5 | 5 | 5 | 5 | — | 5 |
| Hy3 Preview | 4 | 5 | 5 | 5 | — | 5 |
| Claude Sonnet 4.6 | 5 | 4 | 5 | 4 | 4 | 4 |
| Owl Alpha | 3 | 4 | 4 | 4 | — | 5 |
| Gemini 3 Flash | 5 | 5 | 5 | 4 | 5 | 5 |
| DeepSeek V4 Pro | 4 | 5 | 5 | 5 | — | 5 |
| MiniMax M2.7 | 4 | 4 | 4 | 4 | — | 4 |
| Grok 4.1 Fast | 4 | 4 | 4 | 4 | — | 4 |
트렌드 1 — 벤치 역상관이 상시화. a16z 보고대로 벤치 상위와 Token량 상위는 종종 역방향. V4 Flash는 SWE-bench에서 Opus보다 낮아도 Agent 루프 가성비로 양 1위입니다.
트렌드 2 — Token/달러 이중 구조. 양은 중국 OSS, 수익은 서구 클로즈드. 라우팅 설계는 「양의 기본값」과 「품질 예외」를 분리해야 합니다.
트렌드 3 — 주간 신규 부상. MiniMax M2.7, Step 3.5 Flash가 Top 10에 들어 분기 벤치만으로는 따라잡기 어려운 속도로 시장이 움직입니다.
트렌드 4 — 무료 라우트의 양. Owl Alpha 1.15T는 프로토타입·학습 수요. 프로덕션은 유료 라우트나 자체 호스팅으로.
트렌드 5 — 지역 최적화. 중국 9.223T는 규제·가격·자체 호스팅 복합. 미국 4.93T는 엔터프라이즈 계약과 고단가 API 반영.
트렌드 6 — Agent화로 Token 급증. 글로벌 +7.4%는 다단 도구 호출과 긴 컨텍스트 읽기 결과. 200K 전제 예산 설계는 무너지기 쉽습니다.
안내: 주간 데이터는 OpenRouter 공개 통계 기준입니다. 순위는 매주 변동합니다. 프로덕션 라우팅은 주간 대시보드와 내부 청구를 대조해 갱신하십시오.
6단계: 청구 데이터 기반 주간 라우팅 갱신
주간 대시보드 구독: OpenRouter Rankings를 매주 확인하고 Top 10 변동(신규·급락)을 ADR에 기록. 5월 24일 주 MiniMax 진입을 놓치지 마십시오.
Token/달러 이축 예산: 양의 기본값은 V4 Flash, 품질 예외는 Sonnet/Opus. Anthropic Token 12%·달러 46% 괴리를 반영해 고단가 라우트에 서킷 브레이커를 설정합니다.
벤치가 아닌 청구로 A/B: a16z 역상관을 전제로 동일 태스크를 V4 Flash와 Sonnet으로 병행해 품질 차와 달러 차를 측정. 벤치 1위보다 청구 1/10을 우선합니다.
지역과 데이터 경계: 중국발 OSS는 자체 호스팅 병행 가능. Stealth 무료(Owl Alpha)에 기밀 repo를 올리지 마십시오. 로그 마스킹을 ADR에.
Agent 폴백: 다단 도구 호출에서 길을 잃으면 V4 Flash로 자동 강등. Sonnet 고정은 고빈도 루프에서 청구 폭발의 원인입니다.
6단계에서 가장 흔한 실수는 주간 랭킹을 봐도 Sonnet 기본값을 바꾸지 않는 것과 API 라우트만 정리하고 호스트가 절전하는 것입니다. 청구 데이터가 가리키는 최적해는 7×24 실행 환경 없이는 종이 위에 머뭅니다.
인용 데이터·비교표·KVMNODE 클라우드 Mac 선택
글로벌 규모(5월 24일 주): OpenRouter 주간 Token 총량 28.9T, 전주 대비 +7.4%. 중국 9.223T, 미국 4.93T(출처: OpenRouter 주간 통계 2026년 5월).
DeepSeek 지배(동주): V4 Flash 3.43T + V3.2 1.31T + V4 Pro 1.00T = 합계 5.74T. 단일 벤더로 글로벌 약 20% Token 점유(출처: OpenRouter Top 10 집계).
Token/달러 괴리(a16z 2026): Anthropic Token 점유 약 12%, 달러 점유 약 46%. 벤치 상위와 Token량 역상관이 구조적으로 관찰(출처: a16z State of AI 2026).
| 런타임 | 주간 라우팅 갱신 | 약점 | KVMNODE cloud Mac |
|---|---|---|---|
| 로컬 MacBook | 설정은 빠름 | 절전으로 Agent 중단 | 주간 최적해 실행 불가 |
| Linux VPS | CLI는 저렴 | Xcode/Keychain 없음 | Apple 툴체인 불가 |
| cloud Mac Mini M4 | launchd + OpenRouter Key | 임대 기간 설계 필요 | 7×24 Agent + 주간 라우트 갱신에 최적 |
대안을 펼치면 벤치 1위만 보면 a16z 역상관을 무시해 청구가 부풀고, Sonnet 무분별 기본값은 Token 12%·달러 46% 함정에 빠지며, 노트북만 쓰면 주간 랭킹이 가리키는 V4 Flash 기본값이 야간에 멈춥니다. Apple Silicon, OpenRouter 계층 라우팅, Cursor / Claude Code / OpenClaw 7×24 운영 팀에는 KVMNODE 전용 Mac Mini M4 / M4 Pro 대여가 합리적입니다. OpenClaw 상주, 6리전 선택과 일치. 가격, 주문에서 이번 주 라우팅 갱신과 실행 환경을 동시에 정비할 수 있습니다.