Classement OpenRouter juin 2026 : entreprises et Top 10 modeles
OpenRouter compte parmi les sources les plus fiables sur l usage reel des modeles IA : il agrege les appels de millions de developpeurs dans le monde, sans marketing editeur, uniquement les votes de la production. Ce classement indique quel modele les equipes utilisent reellement en environnement de travail.
Par entreprise (volume hebdomadaire de tokens, juin 2026) :
| Rang | Entreprise | Origine | Tokens/semaine | Part de marche |
|---|---|---|---|---|
| 1 | DeepSeek | Chine | 5,13T | 17,6% |
| 2 | Anthropic | Etats-Unis | 4,34T | 14,8% |
| 3 | Etats-Unis | 3,66T | 12,5% | |
| 4 | OpenAI | Etats-Unis | 2,46T | 8,4% |
| 5 | Xiaomi | Chine | 2,42T | 8,3% |
| 6 | MiniMax | Chine | 2,37T | 8,1% |
| 7 | Tencent | Chine | 2,36T | 8,1% |
| 8 | Alibaba Qwen | Chine | 1,26T | 4,3% |
Les editeurs chinois du Top 8 totalisent environ 46 pour cent ; en incluant Moonshot et d autres acteurs, la part chinoise depasse 60 pour cent du trafic developpeur.
Par modele (volume quotidien de tokens, Top 10) :
| Rang | Modele | Editeur | Tokens/jour |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Encore MMLU comme critere : les scores de laboratoire et le portefeuille de production divergent souvent — la facture mensuelle contredit les attentes.
Ignorer les evenements structurels de juin : retrait de Fable 5, rumeurs de double IPO, part chinoise au-dessus de 60 pour cent — trois facteurs qui modifient la logique de routage.
Confondre volume et qualite : la domination de DeepSeek en trafic n implique pas de depasser Opus 4.8 en plafond de qualite.
Dogme mono-modele : un fournisseur code en dur devient rapidement une dette technique apres la vague Q3.
API en ligne, hote hors ligne : un ordinateur portable ferme interrompt les pipelines d agents — aucun classement ne compense l absence de runtime.
Les modeles americains passent de 70 a 30 pour cent en un an : une histoire economique
Un graphique cite par Bloomberg rend la bascule visible :
| Date | Part des modeles US (Google + OpenAI + Anthropic) |
|---|---|
| Juin 2025 | environ 70% |
| Juin 2026 | environ 30% |
Ou sont passes les 40 points de pourcentage ? Vers les modeles chinois. Ce n est pas un phenomene de soutien national — les utilisateurs OpenRouter sont mondiaux, dont une large part aux Etats-Unis, en Europe et en Inde. Ils choisissent DeepSeek, Xiaomi et MiniMax parce que ces modeles sont abordables, rapides et suffisants.
« Avec Claude pour coder, environ 10 dollars de l heure. Avec DeepSeek, moins de 50 cents. » — developpeur de San Diego, citation originale
Ce n est pas une histoire de qualite, c est une histoire economique. Un developpeur de Dallas decrit son mix : « Taches complexes : 500 USD par mois Claude et ChatGPT ; 90 pour cent du code quotidien et reconnaissance vocale via MiniMax, Kimi et MiMo, environ 200 USD par mois. » — routage par complexite et optimisation des couts : la norme en 2026.
Premier en volume n est pas premier en qualite : Opus 4.8, Fable 5 et les trois leviers chinois
Plafond qualite : Claude Opus 4.8 reste premier au global (Artificial Analysis Intelligence Index, fin mai 2026) :
| Modele | Indice qualite | SWE-bench Pro | Remarque |
|---|---|---|---|
| Claude Opus 4.8 | 61,4 (#1) | 69,2% | Long contexte et agents en tete |
| GPT-5.5 | 59–60 | 63,1% | Ecosysteme et appels d outils |
| Gemini 3.1 Pro | 57 | — | Raisonnement le plus difficile |
| Qwen 3.7 Max | 57 | — | Flagship chinois ferme |
| Claude Sonnet 4.6 | — | 80,8% (SWE-bench Verified) | Redaction et suivi d instructions |
Un ingenieur a teste 20 taches : Claude Opus 4.8 en remporte 16, GPT-5.5 5, Gemini 3.1 Pro 4. Sur le long contexte, Opus domine nettement.
Claude Fable 5 obtenait la note maximale (100/100), SWE-bench Verified environ 95 pour cent, mais a ete retire mondialement mi-juin 2026 pour controle des exportations. Statut incertain. Cela confirme que les modeles americains de pointe peuvent encore mener en capacite pure — l accessibilite devient la variable cle.
Champion du volume : les modeles chinois regnent sur les taches courantes par le rapport cout-efficacite, trois axes :
Prix : MiniMax M3 API a 0,60 USD/M token entree, environ 1/8 de Claude Opus 4.8 (5,00 USD/M).
Suffisant : code quotidien, completion, traduction, resume atteignent 80–90 pour cent des modeles de tete.
Poids ouverts : DeepSeek V4, MiniMax M3 en self-hosting pour reduire les risques de confidentialite.
| Cas d usage | Modele recommande | Justification |
|---|---|---|
| Code complexe / Agent | Claude Opus 4.8 | Qualite globale #1, long contexte |
| Code quotidien | DeepSeek V4 Flash / MiMo-V2.5 | Tres abordable, rapide |
| API cout-efficacite maximale | MiniMax M3 | 0,60 USD/M, poids ouverts, self-hosting |
| Long contexte | Kimi K2.6 (1M contexte) | Fenetre tres longue, prix raisonnable |
| Ecosysteme Google | Gemini 3.5 Flash | Support natif Google Workspace |
| Recherche Web temps reel | Grok 4.3 | Contenu X/Twitter en direct |
| Deploiement local | GLM 5.2 / Kimi K2.6 | Poids ouverts de premier plan |
| Generation d images | ChatGPT Images 2.0 | Meilleur rendu de texte |
| Dialogue quotidien | GPT-5.5 | 52,5 pour cent moins d hallucinations vs GPT-5.3, ecosysteme mature |
Six etapes pour un workflow de code IA agnostique du modele
Routage par complexite : 5 pour cent les plus difficiles vers Claude Opus 4.8 / GPT-5.5 ; 95 pour cent du quotidien vers DeepSeek V4 Flash, MiMo-V2.5 ou MiniMax M3.
Passerelle OpenRouter unifiee : suivre openrouter.ai/rankings chaque semaine, eviter un ID de modele code en dur.
Coupures budget et plafonds journaliers : seuils a partir du prix par million de tokens multiplie par le volume quotidien ; batch agent en route bon marche par defaut, refactors complexes sur Opus.
Surveiller la fenetre Q3 : GPT-6, Claude Opus 5, Gemini 4, DeepSeek V5 peuvent arriver en six semaines a partir d aout-septembre — la matrice de routage doit prevoir des slots de bascule.
Evaluer la conformite entreprise separement : les modeles chinois continueront de monter chez les developpeurs individuels, mais les achats Fortune 500 restent contraints par la securite des donnees, la reglementation americaine et le RGPD pour les donnees europeennes — la conformite fixe le plafond.
Provisionner un hote agent 7x24 : migrer Cursor, Claude Code, OpenClaw du portable vers Mac cloud dedie : launchd permanent, Keychain multi-cles API. Voir tarifs et centre d aide.
2026 est presente comme l annee ou les agents passent de l experimentation a la production. Selon le rapport Anthropic sur l etat des agents IA 2026, pres de 44 pour cent des appels API Claude concernent les mathematiques et l informatique — au second semestre, gagne celui qui livre des capacites agent stables.
Previsions second semestre : vague de modeles Q3 et cinq tendances macro
Confirme ou hautement probable (T3 2026) :
| Modele | Editeur | Fenetre | Point cle |
|---|---|---|---|
| GPT-6 | OpenAI | aout-sept. 2026 | Contexte plus long (rumeur 1,5M tokens), agents renforces |
| Claude Opus 5 | Anthropic | vers sept. 2026 | Successeur Opus 4.8, agents long horizon |
| Gemini 4 | T3 2026 | Multimodal, video et audio | |
| DeepSeek V5 | DeepSeek | T3 2026 | Poids ouverts, plus de 1T parametres |
| Grok 4.3+ | xAI | T3 2026 | 1M contexte, Web temps reel |
| GLM 5.2 | Z.ai | publie | Poids ouverts de premier plan, code solide |
Cinq tendances macro :
L axe competitif devient « meilleur modele pour ce scenario » : cinq labs en 90 jours — plus de modele unique « le meilleur ». Frontier ferme pour les 5 pour cent les plus durs, poids ouverts chinois pour 95 pour cent du volume quotidien.
Part chinoise en hausse, conformite entreprise comme plafond : developpeurs individuels possiblement 70 pour cent plus du trafic OpenRouter ; Fortune 500 difficilement au-dessus de 30 pour cent.
Les agents sont le vrai champ de bataille : des scores benchmark a « un workflow agent de 50 etapes fonctionne de facon fiable ».
Pression IPO sur les prix : OpenAI et Anthropic ont signale une intention d IPO en juin 2026 — la pression boursiere peut accelerer la guerre des prix avec les modeles chinois.
Rupture des modeles locaux : d ici 2027, modeles locaux sur GPU grand public (32 Go RAM) pourraient depasser 80 pour cent sur SWE-bench en code.
Note : sources OpenRouter temps reel, Artificial Analysis, SWE-bench Pro ; date 2026-07-01. Classements actuels sur openrouter.ai/rankings.
Le coeur du recit : les marges sur la couche modele se compriment rapidement. DeepSeek a montre debut 2025 qu une excellence ne exige pas le compute maximal. Xiaomi, Tencent, MiniMax et Moonshot ont pousse les prix de base au plancher. Reponse americaine differenciee : OpenAI sur l ecosysteme ; Anthropic sur la qualite ; Google sur vitesse et multimodalite (Gemini Flash comme option closed-source cout-efficace). La zone intermediaire « qualite correcte mais chere » disparait.
Le routage API seul ne remplace pas l hote agent : portable ferme, controle des exportations retire les flagship, deploiement local open weights exige 96 Go plus de memoire unifiee — trois chemins, trois couts caches. Pour des pipelines multi-modeles agent 7x24 stables avec bascule OpenRouter flexible, le Mac Mini cloud dedie KVMNODE est souvent la meilleure option : toolchain Apple Silicon native, durees flexibles. Voir tarifs, commande via commander.