在科技界的瞩目之下,华为再次展示了其在人工智能领域的创新实力。早先,华为创始人任正非在接受媒体采访时曾坦言,华为的单颗AI芯片相较于英伟达存在一代的差距。然而,他强调,华为通过群计算策略,即利用多颗芯片协同工作,以及数学算法优化和非摩尔定律技术来弥补这一差距。
任正非的言下之意清晰明了:在AI芯片领域,比拼的并非单颗芯片的算力,而是整体系统的性能。他比喻道,如同单车不敌多车并行,单颗芯片的性能不足可以通过增加芯片数量来弥补。
为了验证这一理念,华为在近期于上海举办的世界人工智能大会上,正式推出了昇腾384超节点。这一超级计算节点并非新鲜事物,但华为此前一直未将其公之于众。此次亮相,无疑是对任正非此前言论的有力佐证。
昇腾384超节点由384颗昇腾910C芯片和192颗鲲鹏CPU组成,通过先进的总线技术紧密相连,形成一个强大的整体。这一集群的算力高达300 PFLOPs,相当于英伟达旗舰产品GB200 NVL72系统的两倍。这一数据无疑彰显了华为在AI计算领域的强大实力。
英伟达的GB200系统同样采用了集群技术,由72个Blackwell GPU和36个Grace CPU通过NVLink-C2C技术集成。然而,在对比之下,华为的昇腾384超节点在算力、总内存容量以及内存带宽等方面均展现出显著优势。
具体而言,华为的384节点总内存容量是英伟达方案的3.6倍,内存带宽也达到了2.1倍。这意味着在进行AI计算时,华为的方案能够提供更快的速度、更强的算力和更大的容量,从而轻松应对更大的AI模型。
这一创新不仅满足了中国市场的需求,更展现出华为在全球AI芯片领域的竞争力。这或许也是美国对华为AI芯片进行打压,并近期又放开H20限制的原因之一。然而,从华为此次展示的昇腾384超节点来看,其在AI芯片领域的实力已不容小觑。
任正非一贯秉持实事求是的态度,既不夸大其词,也不掩饰不足。他承认单颗AI芯片的性能差距,但同时也分享了华为通过技术创新来弥补这一差距的策略。更重要的是,这一策略并非纸上谈兵,而是华为已经成功实现的技术方案。