华为揭秘：准万亿大模型Pangu Ultra MoE的高效训练之道-天脉财经

在人工智能的发展历程中，经典模型的诞生往往预示着技术革命的新篇章。MoE模型，这一由加拿大学者于上世纪末提出的神经网络结构，便是在AI探索的初期阶段，播下了变革的种子。

时光荏苒，近十年前，硅谷的科技巨头们在理论与工程上实现了对MoE模型的突破，将这一学术理念推向了商业应用的舞台，点燃了AI竞争的火花。而今，这股创新的浪潮已跨越太平洋，来到了中国。以华为为代表的中国科技企业，正引领着MoE架构的新一轮优化与重组。

尤其是华为的MoGE架构，不仅解决了MoE模型中的负载不均衡与效率瓶颈问题，还实现了降本增效，极大地简化了模型的训练与部署流程。这一系列成就，再次彰显了东方智慧在科技领域的独特魅力。

近期，虎嗅推出了《华为技术披露集》系列内容，通过一系列技术报告，全面披露了华为在AI领域的最新技术细节。其中，华为通过“昇腾+Pangu Ultra MoE”的组合，实现了国产算力与国产模型的全流程自主可控训练闭环，且在集群训练系统性能上达到了行业领先水平。

在预训练阶段，昇腾Atlas 800T A2万卡集群的MFU（模型算力利用率）提升了41%；在后训练阶段，单CloudMatrix 384超节点的吞吐能力达到了35K Tokens/s。这一成绩的背后，是华为在技术创新上的不懈追求。

华为在技术报告中首次披露了高效打通大稀疏比MoE强化学习后训练框架的关键技术。这一技术的突破，使得以强化学习为核心的后训练进入了超节点集群时代。在深入探讨Pangu Ultra MoE训练系统之前，我们先来了解一下当前MoE预训练和强化学习后训练所面临的挑战。

这些挑战主要包括并行策略配置困难、All-to-All通信瓶颈、系统负载分布不均、算子调度开销过大、训练流程管理复杂以及大规模扩展受限等。面对这些挑战，华为给出了一套完整的端到端全流程解决方案。

首先，华为通过并行策略智能选择、计算通信深度融合以及全局动态负载平衡等技术，显著提升了训练集群的利用率。华为团队利用系统建模仿真框架，将并行策略选择问题转化为自动化搜索过程，为Pangu Ultra MoE 718B模型确定了最优部署配置。

训练系统建模仿真流程

其次，华为通过Adaptive Pipe前反向通算掩盖、昇腾亲和的训练算子加速以及Host-Device协同的算子下发优化等技术手段，成功释放了昇腾单节点的算力。这些优化措施不仅提升了关键算子的执行效率，还降低了Host资源的瓶颈，实现了微批处理规模的两倍提升。

最后，华为针对强化学习训练中异构模型和多任务场景导致的资源利用率偏低问题，提出了RL Fusion训推共卡技术。这一技术支持多种灵活部署模式，实现了推理阶段资源调度的精细化可控管理，并支持多维并行策略的动态无缝切换。

分离部署、训推共卡部署、全共卡部署资源利用率示意图

通过这一系列技术创新，华为打造了基于MindSpeed、Megatron以及vLLM框架的昇腾全流程高效训练系统。该系统可支持超大规模集群和超大规模MoE模型，并在Pangu Ultra MoE模型训练中实现了端到端的流畅训练。在预训练阶段，华为团队使用昇腾800T A2集群对Pangu Ultra MoE进行训练，模型算力利用率达到了41%。而在RL后训练阶段，每超节点的吞吐能力达到了35K Tokens/s，相当于每2秒就能解决一道高等数学大题。

这一成就不仅展示了华为在AI领域的深厚底蕴，也为中国乃至全球的AI发展注入了新的活力。随着技术的不断进步和应用的不断深化，我们有理由相信，AI的未来将更加美好。

山姆会员商店近期因选品策略调整引发的争议，核心在于会员制商业模式与消费者信任之间的冲突。特供商品缩水：智利西梅被替换为溜溜梅同源产品，虽称“定制款”，但消费者认为仅是包装升级而非品质提升。若无法平衡扩张速…

而对上海这样的城市来说，“优质内容创作”又为何有其独到价值和吸引力，甚至不可或缺？但如果有上述种种的加持，特别是多元场景、丰富要素、开放环境的支持，构建起优质的创新生态，上海的“综合成本”可能是最低的，“综…

"AgentCore是一个模块化服务堆栈（目前处于预览阶段），为开发者提供将AI智能体从原型转向生产所需的核心基础设施，包括运行时、内存、身份认证、可观测性、API集成以及网页浏览和代码执行工具。" A…

7月17日消息，据财联社消息，全球人工智能领军企业OpenAI今日宣布，已将谷歌云（Google Cloud）纳入其核心基础设施供应商列表，为ChatGPT、API服务及后续人工智能模型训练提供算力支持。尽管…

OpenAI 已将谷歌纳入其供应商名单，并明确表示，ChatGPT 及其应用程序接口将同时使用谷歌云平台、微软、CoreWeave和甲骨文的服务。去年，甲骨文宣布与微软和 OpenAI 合作，“将微软 …

当被问及AI的安全发展问题时，黄仁勋向记者表示，安全技术可以是“从内向外”（Insideout）的，即AI系统本身可以靠其他AI来监督；也可以是“从外向内”（Outside in）的，也就是通过外部机制来确…

人工智能，如GPT，是一个辅助的角色，或者可以说是个人代理的角色，它可以辅助或代替你完成日常工作。他认为人工智能时代充满了机遇和责任，所以我认为人工智能这个时代真的是一个非常好的时代，也可能是对于人类来讲最重…

在搜索框内，用户既可以通过打字输入问题，也能直接语音提问；同时，搜索框支持切换自动模式与深度模式：自动模式下，系统会智能识别问题并快速给出答案；深度模式则侧重强化推理过程，进行更深入的思考分析。和百度自家…

她更在意的是，深入社区流动驻点，能让消费者在家门口直观感受适老产品实际效果，有效解决老年群体居家适老化改造认知不足、产品体验渠道缺乏等问题，“企业还可以更精准地洞察消费者需求，以优化服务和产品。”在市民黄女士…

2025年抖音电商护肤市场呈现诸多新趋势，护肤需求从基础养护升级为多维健康美学，消费者追求科学实证与情感满足的平衡，行业向科学化、精准化迭代。四大趋势显著，科技护肤中细胞科技和成分科技成主流，国际与国产品牌…

成都和成锦智网络科技有限公司凭借"精细化运营+数据化服务+本地化赋能"三大核心优势，成为西南地区抖音电商服务领域的标杆企业，为商家提供真正"靠谱"的电商解决方案。运营团队：深谙抖音推荐算法，擅长通过内容优化…

而在全渠道的便利性上，朱晓静以山姆极速达为例称，消费者可以在手机上点击商品，并在一小时内送货上门，实际平均配送时间不到40分钟，有时甚至可以快到15到20分钟，“超过80%的订单，能在一小时内送达。” 事实…

据了解，MiniMax作为上海本土AI企业，在刚刚过去的6月发起为期一周的“技术发布周”，宣布其在基座模型、多模态技术和通用智能体Agent、视频Agent等领域有所突破。 6月17日，MiniMax宣布发…

他在电话里问我，他在公众号上看到一篇介绍信创PC售后服务的文章，里面关于华为终端售后服务的介绍，他觉得有问题，比如说：售后质保为3-5年，主要依托华为手机店接修，无配件，响应慢，部分区域甚至需要送修；另外，由…