华为开发者大会HDC 2025上,华为云计算迎来重大突破。华为常务董事、云计算业务CEO张平安在大会上隆重推出了盘古大模型5.5版本,这一新版本在自然语言理解NLP、计算机视觉CV、预测、多模态以及科学计算五大核心领域实现了全面升级,为各行各业注入了新的活力与价值。
张平安在会上强调,盘古大模型5.5是基于华为昇腾云的全栈软硬件系统训练而成,这标志着昇腾架构在打造世界级大模型方面的能力得到了充分验证。在NLP领域,新发布的718B深度思考模型尤为引人注目。这一模型由256个专家系统组成的MoE大模型,在知识推理、工具调用及数学等多个方面展现出了卓越的能力,引领了行业的新潮流。
盘古大模型5.5在算法层面也进行了诸多创新,如通算掩盖、全局动态均衡以及分组混合专家MoGE等,这些算法共同构建了昇腾亲和的高效训推系统,使得训练MFU和单卡推理吞吐性能达到了业界领先水平。盘古大模型还引入了模型亲和的词表、三明治架构以及EP-Group负载均衡loss等技术,进一步增强了其竞争力。
在用户体验方面,盘古大模型5.5同样带来了显著的提升。例如,该模型采用了自适应快慢思考合一的技术,能够根据问题的难易程度自动切换思考模式,从而实现简单问题的快速回复和复杂问题的深度思考。这一技术使得整体模型的推理效率提升了8倍。盘古深度研究DeepDiver也通过长链难题合成、渐进式奖励等关键技术,在网页搜索、常识性问答等应用场景中展现出了极高的执行效率,极大地提升了工作效率。
除了NLP领域的突破,张平安还在会上分享了计算机视觉CV、预测、多模态以及科学计算等基础模型的技术升级情况。他指出,盘古大模型5.5在农业、工业、科研等多个领域已经实现了丰富的创新应用和落地实践,为行业解决了一系列难题,成为了AI领域的先锋力量。