在国家超算互联网郑州核心节点,3套由中科曙光研发的万卡超集群系统正式启动试运行。这一系统以超过3万张国产加速卡的规模投入运营,成为国内首个实现此量级部署的AI算力平台,能够全面支持万亿参数模型训练、高通量推理以及AI for Science等复杂计算场景,标志着国产智能算力基础设施迈入规模化应用新阶段。
从概念验证到实战落地,这一突破仅用时不到两个月。去年12月,曙光scaleX万卡超集群在HAIC大会首次公开亮相,如今已快速完成技术转化。系统攻克了高速互联网络、存算传一体化设计、高密度供电散热等核心技术难题,通过统一资源调度框架实现算力的高效分配,为大规模AI应用提供了稳定可靠的底层支撑。
在生态兼容性方面,该平台采用开放架构设计,不仅支持CUDA等国际主流软件生态,还能实现多品牌国产加速卡的混合部署。这种灵活性显著降低了开发者的迁移成本,同时具备向十万卡、百万卡规模扩展的能力,为未来算力需求的指数级增长预留了充足空间。目前,系统已通过国家超算互联网实现算力资源的全国一体化调度,为全球用户提供普惠型AI计算服务。
作为创新生态的核心载体,scaleX万卡超集群已完成400余个主流大模型的适配优化,并通过国家超算互联网接入上千款应用。在具体场景中,系统展现出强大赋能能力:支持万亿参数模型的全机训练与故障自动恢复;为头部互联网企业核心业务提供高并发推理服务;助力国内材料研发模型登顶国际榜单,推动蛋白质研究效率提升3至6个数量级。配套的OneScience开发平台进一步降低了多学科交叉研究的门槛,加速科研成果转化。
中科曙光高级副总裁李斌指出,郑州节点的上线是技术突破与产业需求深度融合的成果。公司将以此为起点,持续优化算力性能与稳定性,通过开放合作构建覆盖芯片、算法、应用的完整生态链,让智能算力像水电一样便捷可用,为数字经济高质量发展注入新动能。












