Чем отличаются openPangu 2.0 Flash и Pro?

Flash: 92B параметров всего, 6B активных, доступен с 30 июня. Pro: 505B всего, 18B активных, планируется в июле. Обе версии поддерживают контекст 512K, обучение полностью на Ascend 910B.

openPangu 2.0 действительно обучали без GPU NVIDIA?

Да. Всё обучение прошло на NPU Huawei Ascend 910B без A100 или H100. Это первый frontier open-source модель такого масштаба, обученный и опубликованный на не-NVIDIA железе.

openPangu 2.0 или DeepSeek V4 Pro — что выбрать?

Генерация кода и сложные рассуждения: DeepSeek V4 Pro (~200B активных параметров). Сверхдлинные документы (>256K токенов), требования суверенности и развёртывание на Ascend: openPangu 2.0 Pro (512K контекст, нативная оптимизация Ascend, full-stack open source).

Где скачать веса openPangu 2.0?

Веса Flash и код инференса на GitCode Ascend Tribe: gitcode.com/org/ascend-tribe/repos. Либо подписка ModelArts AI Gallery для вызова API без собственного железа.

Какое железо нужно для openPangu 2.0 Flash?

Рекомендуется одна карта Ascend 910B (~96 ГБ unified memory). Flash-Int8: ~48 ГБ, −40% памяти, потеря точности менее 10%.

Какая среда выполнения нужна агенту с API openPangu?

Cursor, OpenClaw и аналоги требуют macOS 7×24 для нескольких API-ключей и webhook. Выделенные Mac Mini KVMNODE масштабируются по дням, неделям или месяцам — см. страницу цен.

Huawei openPangu 2.0 open source: MoE 505B, контекст 512K, полный стек Ascend

Для разработчиков и технических лидеров, следящих за openPangu 2.0 open source, LLM на Ascend и требованиями суверенности: 30 июня 2026 Huawei выполнила обещание HDC 2026 — веса и код инференса openPangu-2.0-Flash вышли на GitCode. Статья опирается на официальные релизы и охватывает хронологию и 7 open-source компонентов, сравнение Pro/Flash, архитектуру mHC/Muon/ModAttn, полный стек обучения Ascend 910B, матрицу конкурентов vs DeepSeek/Qwen/Kimi, развёртывание ModelArts API и GitCode в шесть шагов, а также стратегическое значение и дорожную карту open source.

HDC 2026 и ключевые факты openPangu 2.0: хронология, две версии и 7 компонентов

12 июня 2026 прошла Huawei Developer Conference HDC 2026 в Дунгуане (Songshan Lake); Richard Yu представил openPangu 2.0 на keynote. 30 июня веса openPangu-2.0-Flash, базовый код инференса и операторы train/inference вышли в open source на GitCode — не очередная open-weights модель, а первый frontier open-source LLM, полностью обученный без железа NVIDIA, и один из немногих сверхкрупных MoE с настоящим full-stack open source.

Дата	Событие
2026-06-12	HDC 2026 keynote: официальный анонс openPangu 2.0
2026-06-30	Веса Flash, код инференса, операторы на GitCode ✅
2026-07 (план)	Веса Pro и код инференса 🔜
H2 2026 (план)	Код pre-training, post-training, больше операторов 📋

Две версии, единый ultra-long контекст 512K:

Версия	Всего параметров	Активных	Sparsity	Контекст	Статус
openPangu 2.0 Pro	505B	18B	~28:1	512K	План на июль
openPangu 2.0 Flash	92B	6B	~15:1	512K	Live 30.06

512K контекста — это примерно 8 томов «Задачи трёх тел» (книга 1): полный договор, крупная кодовая база или длинная история диалога за один проход.

7 планируемых open-source компонентов:

Архитектура модели (определение структуры) — ✅ опубликовано 30.06

Веса модели (Flash live 30.06, Pro — июль)

Technical report (синхронно с весами) — ✅

Код инференса + операторы train/inference — ✅ 30.06

Код pre-training (H2, редкость для отрасли)

Первые четыре пункта — отраслевая норма; последние три (pre/post-training + Ascend-операторы) при таком масштабе MoE исключительны — настоящий full-stack open source.

Код post-training (SFT/RLHF, публикация H2)

Training operators (custom Ascend HPC ops, H2)

Смотреть только на бенчмарки, игнорировать глубину open source: Большинство моделей открывают лишь веса + инференс — обучение не воспроизвести.

Путать сроки Flash и Pro: Flash с 30.06, веса Pro — в июле.

Недооценивать аппаратные ограничения: Гонять NVIDIA-оптимизированную модель на Ascend — просадка throughput и рост затрат.

Недооценивать ценность 512K: Конкуренты с 128K не проглотят целую кодовую базу или юридический контракт.

Agent-host offline: API работает, но ноутбук закрыт — пайплайны HarmonyOS/OpenClaw всё равно рвутся.

openPangu 2.0 в деталях: инновации MoE, full-stack обучение Ascend и квантизация

openPangu 2.0 использует архитектуру MoE (Mixture of Experts) с ключевыми технологиями:

Технология	Назначение
mHC routing (Multi-Head Combinatorial)	Более эффективная маршрутизация экспертов, меньше дисбаланса нагрузки
Оптимизатор Muon	Second-order momentum от Microsoft, стабильнее крупномасштабное обучение
ModAttn (Modular Attention)	Модульное внимание для контекста 512K
Ultra-sparse DSA+SWA attention (только Flash)	Экстремальная sparsity, резко ниже compute на инференсе

Первое frontier-обучение «без NVIDIA»: Полностью на Huawei Ascend 910B NPU, без A100 или H100. На фоне ужесточения US export control на AI-чипы Huawei не только обучила MoE 505B, но и достигла:

Throughput одной карты ×2 vs mainstream open-source моделей (Ascend-affine архитектура)

Эффективность super-node +30%

Throughput обучения последовательностей 512K +50%

Согласованность train-inference >99% (классическая боль MoE, высокая инженерная ценность)

Edge-модель 30B: инференс +50%, −20% памяти, offline на смартфонах Kirin

Стек разработчика: ПО на базе CANN (Huawei, аналог CUDA) + torch_npu (адаптер PyTorch). Стандартный PyTorch переключается через import torch_npu. Развёртывание: API Huawei Cloud ModelArts, self-host GitCode Ascend Tribe, edge HarmonyOS.

Квантизированная версия Flash-Int8 W4A8: −40% памяти, потеря точности <10%.

Python

import torch
import torch_npu

model = load_openpangu("./openPangu-Flash")
model = model.to("npu:0")
output = model.generate(input_ids.to("npu:0"), max_new_tokens=512, temperature=0.7)

openPangu 2.0 vs DeepSeek, Qwen, Kimi: матрица конкурентов и выбор по сценарию

Модель	Всего параметров	Активных	Контекст	HW обучения	Глубина open source
openPangu 2.0 Pro	505B	18B	512K	Ascend NPU	Full-stack (7 компонентов)
openPangu 2.0 Flash	92B	6B	512K	Ascend NPU	Full-stack (7 компонентов)
DeepSeek V4 Pro	1.6T	~200B	128K	NVIDIA	Веса + инференс
Qwen 3.7 Max	~400B+	varies	128K	NVIDIA	Веса + инференс + часть training
Kimi K2.7	1T	32B	256K	NVIDIA	Веса + инференс
Llama 4 405B	405B	—	128K	NVIDIA	Веса + инференс

Матрица возможностей (оценка по архитектуре; независимые бенчмарки в процессе):

Измерение	openPangu 2.0 Pro	DeepSeek V4 Pro	Qwen 3.7 Max	Kimi K2.7
Генерация кода	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
Сложные рассуждения	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
Tool use / Agent	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
Ultra-long контекст	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐
Эффективность инференса	⭐⭐⭐⭐⭐	⭐⭐	⭐⭐	⭐⭐⭐⭐
Суверенность / compliance	⭐⭐⭐⭐⭐	⭐	⭐	⭐
Full-stack open source	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐

Сценарий	Рекомендация	Причина
Код / сложные рассуждения	DeepSeek V4 Pro	200B активных, лидирующая производительность
Agent / multi-tool	Kimi K2.7	Наиболее зрелая MCP-экосистема
Сверхдлинные документы (>256K токенов)	openPangu 2.0 Pro	512K контекст — первый выбор
Domestic / суверенность	openPangu 2.0	Единственная frontier-модель на чисто domestic HW
Ascend / Huawei Cloud	openPangu 2.0	Нативная оптимизация, throughput ×2
Edge / смартфон	openPangu Embedded (30B)	Локальный запуск на Kirin
Дешёвый локальный инференс	openPangu 2.0 Flash	6B активных, ~96 ГБ достаточно

openPangu 2.0 пока не сильнейший универсальный open-source LLM (код/рассуждения: DeepSeek V4 Pro явно впереди), но по 512K ultra-контексту, суверенности/compliance, нативному Ascend throughput ×2, full-stack open source и edge-развёртыванию почти без альтернатив.

Как использовать openPangu 2.0: API ModelArts и self-host GitCode в шесть шагов

Аккаунт Huawei Cloud, ModelArts → AI Gallery → поиск «openPangu 2.0», подписка Flash или Pro, получение API endpoint (быстрый старт без железа).

Вызов API: POST в формате Chat Completions, ID модели openpangu-2.0-flash.

Скачать веса с GitCode: gitcode.com/org/ascend-tribe, клонировать openPangu-2.0-Flash, openPangu-2.0-Infer, openPangu-2.0-Op.

Single-card инференс Flash (Ascend 910B): python inference.py --model_path ./openPangu-Flash --device npu:0 --context_length 512000 --precision bf16

Multi-card distributed инференс Pro (после весов Pro в июле): python distributed_inference.py --model_path ./openPangu-Pro --num_devices 8 --context_length 512000

Domain finetuning (LoRA): python finetune.py --model_path ./openPangu-Pro --data_path ./domain_data --method lora --lora_rank 16 (полный re-pre-training возможен после публикации кода H2).

bash

curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: ${TOKEN}" \
  -d '{"model":"openpangu-2.0-flash","messages":[{"role":"user","content":"Привет"}],"max_tokens":1024,"temperature":0.7}'

Версия	Рекомендуемое железо	Минимум	Примечание
Flash (6B активных)	Одна Ascend 910B	~96 ГБ unified memory	Community-тесты на больших RAM-системах возможны
Flash-Int8	Одна Ascend Atlas A2	~48 ГБ VRAM	W4A8, потеря точности <10%
Pro (18B активных)	4+ Ascend 910B	Multi-card кластер	Проверка после релиза Pro в июле

Стратегическое значение, openPangu License и дорожная карта open source

Геополитика и исторический контекст: openPangu 2.0 — первый frontier open-source LLM, обученный без NVIDIA. Richard Yu на HDC 2026: «В оставшейся жизни в моём словаре нет второго места — только первое.» Full-stack open source поддерживает исследования (воспроизведение обучения), отраслевую кастомизацию (vertical re-pre-training) и экосистему Ascend.

База для HarmonyOS Agent: HarmonyOS 7 полностью входит в эру агентов; openPangu 2.0 — нативный AI-движок для agent-задач; HarmonyOS Agent Framework 2.0: >90% успеха на сложных задачах; edge-модель 30B на смартфоне без сети.

openPangu License: Коммерческое использование разрешено, без роялти, неэксклюзивно; детали в репозиториях GitCode.

Дорожная карта open source:

Дата	Содержание
2026-06-30 ✅	Веса Flash + код инференса + операторы
2026-07 🔜	Веса Pro + код инференса
H2 2026 📋	Pre/post-training код, больше операторов, data tools

505B / 18B активных / 512K: Pro среди самых длинных контекстных окон среди текущих open-моделей.

92B / 6B активных / ~15:1 sparsity: Flash почти как dense 6B по скорости, база знаний 92B.

Согласованность train-inference >99%: редкая инженерная метрика для MoE.

Примечание: Часть benchmark-оценок основана на архитектурном выводе; независимые тесты будут добавлены после публикации. Дата 2026-07-01. Источники: GitCode Ascend Tribe, Huawei Developer, анонс HDC 2026.

Один лишь API не заменяет production agent-host: ноутбук закрыт, хаос с multi-key, пайплайны HarmonyOS/OpenClaw требуют постоянного macOS — локальный debug и cloud API имеют скрытые издержки. Для стабильных multi-model агентов 7×24 с ModelArts и маршрутизацией OpenRouter выделенный cloud Mac Mini KVMNODE часто оптимален: нативный Apple Silicon toolchain, гибкие сроки. Подробнее: цены, центр помощи, заказ: оформить заказ.

Назад к блогу Арендовать