HDC 2026 и ключевые факты openPangu 2.0: хронология, две версии и 7 компонентов
12 июня 2026 прошла Huawei Developer Conference HDC 2026 в Дунгуане (Songshan Lake); Richard Yu представил openPangu 2.0 на keynote. 30 июня веса openPangu-2.0-Flash, базовый код инференса и операторы train/inference вышли в open source на GitCode — не очередная open-weights модель, а первый frontier open-source LLM, полностью обученный без железа NVIDIA, и один из немногих сверхкрупных MoE с настоящим full-stack open source.
| Дата | Событие |
|---|---|
| 2026-06-12 | HDC 2026 keynote: официальный анонс openPangu 2.0 |
| 2026-06-30 | Веса Flash, код инференса, операторы на GitCode ✅ |
| 2026-07 (план) | Веса Pro и код инференса 🔜 |
| H2 2026 (план) | Код pre-training, post-training, больше операторов 📋 |
Две версии, единый ultra-long контекст 512K:
| Версия | Всего параметров | Активных | Sparsity | Контекст | Статус |
|---|---|---|---|---|---|
| openPangu 2.0 Pro | 505B | 18B | ~28:1 | 512K | План на июль |
| openPangu 2.0 Flash | 92B | 6B | ~15:1 | 512K | Live 30.06 |
512K контекста — это примерно 8 томов «Задачи трёх тел» (книга 1): полный договор, крупная кодовая база или длинная история диалога за один проход.
7 планируемых open-source компонентов:
Архитектура модели (определение структуры) — ✅ опубликовано 30.06
Веса модели (Flash live 30.06, Pro — июль)
Technical report (синхронно с весами) — ✅
Код инференса + операторы train/inference — ✅ 30.06
Код pre-training (H2, редкость для отрасли)
Первые четыре пункта — отраслевая норма; последние три (pre/post-training + Ascend-операторы) при таком масштабе MoE исключительны — настоящий full-stack open source.
Код post-training (SFT/RLHF, публикация H2)
Training operators (custom Ascend HPC ops, H2)
Смотреть только на бенчмарки, игнорировать глубину open source: Большинство моделей открывают лишь веса + инференс — обучение не воспроизвести.
Путать сроки Flash и Pro: Flash с 30.06, веса Pro — в июле.
Недооценивать аппаратные ограничения: Гонять NVIDIA-оптимизированную модель на Ascend — просадка throughput и рост затрат.
Недооценивать ценность 512K: Конкуренты с 128K не проглотят целую кодовую базу или юридический контракт.
Agent-host offline: API работает, но ноутбук закрыт — пайплайны HarmonyOS/OpenClaw всё равно рвутся.
openPangu 2.0 в деталях: инновации MoE, full-stack обучение Ascend и квантизация
openPangu 2.0 использует архитектуру MoE (Mixture of Experts) с ключевыми технологиями:
| Технология | Назначение |
|---|---|
| mHC routing (Multi-Head Combinatorial) | Более эффективная маршрутизация экспертов, меньше дисбаланса нагрузки |
| Оптимизатор Muon | Second-order momentum от Microsoft, стабильнее крупномасштабное обучение |
| ModAttn (Modular Attention) | Модульное внимание для контекста 512K |
| Ultra-sparse DSA+SWA attention (только Flash) | Экстремальная sparsity, резко ниже compute на инференсе |
Первое frontier-обучение «без NVIDIA»: Полностью на Huawei Ascend 910B NPU, без A100 или H100. На фоне ужесточения US export control на AI-чипы Huawei не только обучила MoE 505B, но и достигла:
Throughput одной карты ×2 vs mainstream open-source моделей (Ascend-affine архитектура)
Эффективность super-node +30%
Throughput обучения последовательностей 512K +50%
Согласованность train-inference >99% (классическая боль MoE, высокая инженерная ценность)
Edge-модель 30B: инференс +50%, −20% памяти, offline на смартфонах Kirin
Стек разработчика: ПО на базе CANN (Huawei, аналог CUDA) + torch_npu (адаптер PyTorch). Стандартный PyTorch переключается через import torch_npu. Развёртывание: API Huawei Cloud ModelArts, self-host GitCode Ascend Tribe, edge HarmonyOS.
Квантизированная версия Flash-Int8 W4A8: −40% памяти, потеря точности <10%.
import torch
import torch_npu
model = load_openpangu("./openPangu-Flash")
model = model.to("npu:0")
output = model.generate(input_ids.to("npu:0"), max_new_tokens=512, temperature=0.7)openPangu 2.0 vs DeepSeek, Qwen, Kimi: матрица конкурентов и выбор по сценарию
| Модель | Всего параметров | Активных | Контекст | HW обучения | Глубина open source |
|---|---|---|---|---|---|
| openPangu 2.0 Pro | 505B | 18B | 512K | Ascend NPU | Full-stack (7 компонентов) |
| openPangu 2.0 Flash | 92B | 6B | 512K | Ascend NPU | Full-stack (7 компонентов) |
| DeepSeek V4 Pro | 1.6T | ~200B | 128K | NVIDIA | Веса + инференс |
| Qwen 3.7 Max | ~400B+ | varies | 128K | NVIDIA | Веса + инференс + часть training |
| Kimi K2.7 | 1T | 32B | 256K | NVIDIA | Веса + инференс |
| Llama 4 405B | 405B | — | 128K | NVIDIA | Веса + инференс |
Матрица возможностей (оценка по архитектуре; независимые бенчмарки в процессе):
| Измерение | openPangu 2.0 Pro | DeepSeek V4 Pro | Qwen 3.7 Max | Kimi K2.7 |
|---|---|---|---|---|
| Генерация кода | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| Сложные рассуждения | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| Tool use / Agent | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| Ultra-long контекст | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ |
| Эффективность инференса | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ |
| Суверенность / compliance | ⭐⭐⭐⭐⭐ | ⭐ | ⭐ | ⭐ |
| Full-stack open source | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| Сценарий | Рекомендация | Причина |
|---|---|---|
| Код / сложные рассуждения | DeepSeek V4 Pro | 200B активных, лидирующая производительность |
| Agent / multi-tool | Kimi K2.7 | Наиболее зрелая MCP-экосистема |
| Сверхдлинные документы (>256K токенов) | openPangu 2.0 Pro | 512K контекст — первый выбор |
| Domestic / суверенность | openPangu 2.0 | Единственная frontier-модель на чисто domestic HW |
| Ascend / Huawei Cloud | openPangu 2.0 | Нативная оптимизация, throughput ×2 |
| Edge / смартфон | openPangu Embedded (30B) | Локальный запуск на Kirin |
| Дешёвый локальный инференс | openPangu 2.0 Flash | 6B активных, ~96 ГБ достаточно |
openPangu 2.0 пока не сильнейший универсальный open-source LLM (код/рассуждения: DeepSeek V4 Pro явно впереди), но по 512K ultra-контексту, суверенности/compliance, нативному Ascend throughput ×2, full-stack open source и edge-развёртыванию почти без альтернатив.
Как использовать openPangu 2.0: API ModelArts и self-host GitCode в шесть шагов
Аккаунт Huawei Cloud, ModelArts → AI Gallery → поиск «openPangu 2.0», подписка Flash или Pro, получение API endpoint (быстрый старт без железа).
Вызов API: POST в формате Chat Completions, ID модели openpangu-2.0-flash.
Скачать веса с GitCode: gitcode.com/org/ascend-tribe, клонировать openPangu-2.0-Flash, openPangu-2.0-Infer, openPangu-2.0-Op.
Single-card инференс Flash (Ascend 910B): python inference.py --model_path ./openPangu-Flash --device npu:0 --context_length 512000 --precision bf16
Multi-card distributed инференс Pro (после весов Pro в июле): python distributed_inference.py --model_path ./openPangu-Pro --num_devices 8 --context_length 512000
Domain finetuning (LoRA): python finetune.py --model_path ./openPangu-Pro --data_path ./domain_data --method lora --lora_rank 16 (полный re-pre-training возможен после публикации кода H2).
curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
-H "Content-Type: application/json" \
-H "X-Auth-Token: ${TOKEN}" \
-d '{"model":"openpangu-2.0-flash","messages":[{"role":"user","content":"Привет"}],"max_tokens":1024,"temperature":0.7}'| Версия | Рекомендуемое железо | Минимум | Примечание |
|---|---|---|---|
| Flash (6B активных) | Одна Ascend 910B | ~96 ГБ unified memory | Community-тесты на больших RAM-системах возможны |
| Flash-Int8 | Одна Ascend Atlas A2 | ~48 ГБ VRAM | W4A8, потеря точности <10% |
| Pro (18B активных) | 4+ Ascend 910B | Multi-card кластер | Проверка после релиза Pro в июле |
Стратегическое значение, openPangu License и дорожная карта open source
Геополитика и исторический контекст: openPangu 2.0 — первый frontier open-source LLM, обученный без NVIDIA. Richard Yu на HDC 2026: «В оставшейся жизни в моём словаре нет второго места — только первое.» Full-stack open source поддерживает исследования (воспроизведение обучения), отраслевую кастомизацию (vertical re-pre-training) и экосистему Ascend.
База для HarmonyOS Agent: HarmonyOS 7 полностью входит в эру агентов; openPangu 2.0 — нативный AI-движок для agent-задач; HarmonyOS Agent Framework 2.0: >90% успеха на сложных задачах; edge-модель 30B на смартфоне без сети.
openPangu License: Коммерческое использование разрешено, без роялти, неэксклюзивно; детали в репозиториях GitCode.
Дорожная карта open source:
| Дата | Содержание |
|---|---|
| 2026-06-30 ✅ | Веса Flash + код инференса + операторы |
| 2026-07 🔜 | Веса Pro + код инференса |
| H2 2026 📋 | Pre/post-training код, больше операторов, data tools |
505B / 18B активных / 512K: Pro среди самых длинных контекстных окон среди текущих open-моделей.
92B / 6B активных / ~15:1 sparsity: Flash почти как dense 6B по скорости, база знаний 92B.
Согласованность train-inference >99%: редкая инженерная метрика для MoE.
Примечание: Часть benchmark-оценок основана на архитектурном выводе; независимые тесты будут добавлены после публикации. Дата 2026-07-01. Источники: GitCode Ascend Tribe, Huawei Developer, анонс HDC 2026.
Один лишь API не заменяет production agent-host: ноутбук закрыт, хаос с multi-key, пайплайны HarmonyOS/OpenClaw требуют постоянного macOS — локальный debug и cloud API имеют скрытые издержки. Для стабильных multi-model агентов 7×24 с ModelArts и маршрутизацией OpenRouter выделенный cloud Mac Mini KVMNODE часто оптимален: нативный Apple Silicon toolchain, гибкие сроки. Подробнее: цены, центр помощи, заказ: оформить заказ.