Для разработчиков и технических лидеров, следящих за openPangu 2.0 open source, LLM на Ascend и требованиями суверенности: 30 июня 2026 Huawei выполнила обещание HDC 2026 — веса и код инференса openPangu-2.0-Flash вышли на GitCode. Статья опирается на официальные релизы и охватывает хронологию и 7 open-source компонентов, сравнение Pro/Flash, архитектуру mHC/Muon/ModAttn, полный стек обучения Ascend 910B, матрицу конкурентов vs DeepSeek/Qwen/Kimi, развёртывание ModelArts API и GitCode в шесть шагов, а также стратегическое значение и дорожную карту open source.
01

HDC 2026 и ключевые факты openPangu 2.0: хронология, две версии и 7 компонентов

12 июня 2026 прошла Huawei Developer Conference HDC 2026 в Дунгуане (Songshan Lake); Richard Yu представил openPangu 2.0 на keynote. 30 июня веса openPangu-2.0-Flash, базовый код инференса и операторы train/inference вышли в open source на GitCode — не очередная open-weights модель, а первый frontier open-source LLM, полностью обученный без железа NVIDIA, и один из немногих сверхкрупных MoE с настоящим full-stack open source.

ДатаСобытие
2026-06-12HDC 2026 keynote: официальный анонс openPangu 2.0
2026-06-30Веса Flash, код инференса, операторы на GitCode ✅
2026-07 (план)Веса Pro и код инференса 🔜
H2 2026 (план)Код pre-training, post-training, больше операторов 📋

Две версии, единый ultra-long контекст 512K:

ВерсияВсего параметровАктивныхSparsityКонтекстСтатус
openPangu 2.0 Pro505B18B~28:1512KПлан на июль
openPangu 2.0 Flash92B6B~15:1512KLive 30.06

512K контекста — это примерно 8 томов «Задачи трёх тел» (книга 1): полный договор, крупная кодовая база или длинная история диалога за один проход.

7 планируемых open-source компонентов:

01

Архитектура модели (определение структуры) — ✅ опубликовано 30.06

02

Веса модели (Flash live 30.06, Pro — июль)

03

Technical report (синхронно с весами) — ✅

04

Код инференса + операторы train/inference — ✅ 30.06

05

Код pre-training (H2, редкость для отрасли)

Первые четыре пункта — отраслевая норма; последние три (pre/post-training + Ascend-операторы) при таком масштабе MoE исключительны — настоящий full-stack open source.

06

Код post-training (SFT/RLHF, публикация H2)

07

Training operators (custom Ascend HPC ops, H2)

01

Смотреть только на бенчмарки, игнорировать глубину open source: Большинство моделей открывают лишь веса + инференс — обучение не воспроизвести.

02

Путать сроки Flash и Pro: Flash с 30.06, веса Pro — в июле.

03

Недооценивать аппаратные ограничения: Гонять NVIDIA-оптимизированную модель на Ascend — просадка throughput и рост затрат.

04

Недооценивать ценность 512K: Конкуренты с 128K не проглотят целую кодовую базу или юридический контракт.

05

Agent-host offline: API работает, но ноутбук закрыт — пайплайны HarmonyOS/OpenClaw всё равно рвутся.

02

openPangu 2.0 в деталях: инновации MoE, full-stack обучение Ascend и квантизация

openPangu 2.0 использует архитектуру MoE (Mixture of Experts) с ключевыми технологиями:

ТехнологияНазначение
mHC routing (Multi-Head Combinatorial)Более эффективная маршрутизация экспертов, меньше дисбаланса нагрузки
Оптимизатор MuonSecond-order momentum от Microsoft, стабильнее крупномасштабное обучение
ModAttn (Modular Attention)Модульное внимание для контекста 512K
Ultra-sparse DSA+SWA attention (только Flash)Экстремальная sparsity, резко ниже compute на инференсе

Первое frontier-обучение «без NVIDIA»: Полностью на Huawei Ascend 910B NPU, без A100 или H100. На фоне ужесточения US export control на AI-чипы Huawei не только обучила MoE 505B, но и достигла:

01

Throughput одной карты ×2 vs mainstream open-source моделей (Ascend-affine архитектура)

02

Эффективность super-node +30%

03

Throughput обучения последовательностей 512K +50%

04

Согласованность train-inference >99% (классическая боль MoE, высокая инженерная ценность)

05

Edge-модель 30B: инференс +50%, −20% памяти, offline на смартфонах Kirin

Стек разработчика: ПО на базе CANN (Huawei, аналог CUDA) + torch_npu (адаптер PyTorch). Стандартный PyTorch переключается через import torch_npu. Развёртывание: API Huawei Cloud ModelArts, self-host GitCode Ascend Tribe, edge HarmonyOS.

Квантизированная версия Flash-Int8 W4A8: −40% памяти, потеря точности <10%.

Python
import torch
import torch_npu

model = load_openpangu("./openPangu-Flash")
model = model.to("npu:0")
output = model.generate(input_ids.to("npu:0"), max_new_tokens=512, temperature=0.7)
03

openPangu 2.0 vs DeepSeek, Qwen, Kimi: матрица конкурентов и выбор по сценарию

МодельВсего параметровАктивныхКонтекстHW обученияГлубина open source
openPangu 2.0 Pro505B18B512KAscend NPUFull-stack (7 компонентов)
openPangu 2.0 Flash92B6B512KAscend NPUFull-stack (7 компонентов)
DeepSeek V4 Pro1.6T~200B128KNVIDIAВеса + инференс
Qwen 3.7 Max~400B+varies128KNVIDIAВеса + инференс + часть training
Kimi K2.71T32B256KNVIDIAВеса + инференс
Llama 4 405B405B128KNVIDIAВеса + инференс

Матрица возможностей (оценка по архитектуре; независимые бенчмарки в процессе):

ИзмерениеopenPangu 2.0 ProDeepSeek V4 ProQwen 3.7 MaxKimi K2.7
Генерация кода⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Сложные рассуждения⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Tool use / Agent⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Ultra-long контекст⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Эффективность инференса⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Суверенность / compliance⭐⭐⭐⭐⭐
Full-stack open source⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
СценарийРекомендацияПричина
Код / сложные рассужденияDeepSeek V4 Pro200B активных, лидирующая производительность
Agent / multi-toolKimi K2.7Наиболее зрелая MCP-экосистема
Сверхдлинные документы (>256K токенов)openPangu 2.0 Pro512K контекст — первый выбор
Domestic / суверенностьopenPangu 2.0Единственная frontier-модель на чисто domestic HW
Ascend / Huawei CloudopenPangu 2.0Нативная оптимизация, throughput ×2
Edge / смартфонopenPangu Embedded (30B)Локальный запуск на Kirin
Дешёвый локальный инференсopenPangu 2.0 Flash6B активных, ~96 ГБ достаточно

openPangu 2.0 пока не сильнейший универсальный open-source LLM (код/рассуждения: DeepSeek V4 Pro явно впереди), но по 512K ultra-контексту, суверенности/compliance, нативному Ascend throughput ×2, full-stack open source и edge-развёртыванию почти без альтернатив.

04

Как использовать openPangu 2.0: API ModelArts и self-host GitCode в шесть шагов

01

Аккаунт Huawei Cloud, ModelArts → AI Gallery → поиск «openPangu 2.0», подписка Flash или Pro, получение API endpoint (быстрый старт без железа).

02

Вызов API: POST в формате Chat Completions, ID модели openpangu-2.0-flash.

03

Скачать веса с GitCode: gitcode.com/org/ascend-tribe, клонировать openPangu-2.0-Flash, openPangu-2.0-Infer, openPangu-2.0-Op.

04

Single-card инференс Flash (Ascend 910B): python inference.py --model_path ./openPangu-Flash --device npu:0 --context_length 512000 --precision bf16

05

Multi-card distributed инференс Pro (после весов Pro в июле): python distributed_inference.py --model_path ./openPangu-Pro --num_devices 8 --context_length 512000

06

Domain finetuning (LoRA): python finetune.py --model_path ./openPangu-Pro --data_path ./domain_data --method lora --lora_rank 16 (полный re-pre-training возможен после публикации кода H2).

bash
curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: ${TOKEN}" \
  -d '{"model":"openpangu-2.0-flash","messages":[{"role":"user","content":"Привет"}],"max_tokens":1024,"temperature":0.7}'
ВерсияРекомендуемое железоМинимумПримечание
Flash (6B активных)Одна Ascend 910B~96 ГБ unified memoryCommunity-тесты на больших RAM-системах возможны
Flash-Int8Одна Ascend Atlas A2~48 ГБ VRAMW4A8, потеря точности <10%
Pro (18B активных)4+ Ascend 910BMulti-card кластерПроверка после релиза Pro в июле
05

Стратегическое значение, openPangu License и дорожная карта open source

Геополитика и исторический контекст: openPangu 2.0 — первый frontier open-source LLM, обученный без NVIDIA. Richard Yu на HDC 2026: «В оставшейся жизни в моём словаре нет второго места — только первое.» Full-stack open source поддерживает исследования (воспроизведение обучения), отраслевую кастомизацию (vertical re-pre-training) и экосистему Ascend.

База для HarmonyOS Agent: HarmonyOS 7 полностью входит в эру агентов; openPangu 2.0 — нативный AI-движок для agent-задач; HarmonyOS Agent Framework 2.0: >90% успеха на сложных задачах; edge-модель 30B на смартфоне без сети.

openPangu License: Коммерческое использование разрешено, без роялти, неэксклюзивно; детали в репозиториях GitCode.

Дорожная карта open source:

ДатаСодержание
2026-06-30 ✅Веса Flash + код инференса + операторы
2026-07 🔜Веса Pro + код инференса
H2 2026 📋Pre/post-training код, больше операторов, data tools
A

505B / 18B активных / 512K: Pro среди самых длинных контекстных окон среди текущих open-моделей.

B

92B / 6B активных / ~15:1 sparsity: Flash почти как dense 6B по скорости, база знаний 92B.

C

Согласованность train-inference >99%: редкая инженерная метрика для MoE.

Примечание: Часть benchmark-оценок основана на архитектурном выводе; независимые тесты будут добавлены после публикации. Дата 2026-07-01. Источники: GitCode Ascend Tribe, Huawei Developer, анонс HDC 2026.

Один лишь API не заменяет production agent-host: ноутбук закрыт, хаос с multi-key, пайплайны HarmonyOS/OpenClaw требуют постоянного macOS — локальный debug и cloud API имеют скрытые издержки. Для стабильных multi-model агентов 7×24 с ModelArts и маршрутизацией OpenRouter выделенный cloud Mac Mini KVMNODE часто оптимален: нативный Apple Silicon toolchain, гибкие сроки. Подробнее: цены, центр помощи, заказ: оформить заказ.