在AI行业迅猛发展的当下,全球对Token的需求持续攀升,但国内算力产业却面临重重挑战。海外高端GPU供应受限,采购门槛不断抬高,国内AI企业长期面临“一卡难求”的困境。与此同时,传统2D芯片和HBM方案难以突破“内存墙”,数据反复搬运导致能耗和成本居高不下。许多国内芯片企业试图沿着海外GPU的成熟路线追赶,却因先进制程和软件生态的壁垒而步履维艰。
在这样的背景下,算苗科技自2019年起便坚定选择3D混合键合这一少有人涉足的技术路线。团队经过多年努力,打磨了上万片3D堆叠晶圆,克服了产业链不成熟、良率攻关等难题。当多数企业还在观望3D技术的可行性时,算苗科技已逐步建立起国产供应链体系,走出了一条不依赖海外先进制程、区别于英伟达的全新3D TokenPU技术路径,为国产算力提供了新的突破方向。
6月17日,算苗科技在北京举办媒体沟通会,宣布国内首颗面向大模型推理的3D TokenPU芯片A4E已于6月15日成功流片。这一成果标志着国产云端大算力芯片取得关键突破,为国内AI算力行业注入了新的活力。目前,算苗科技的突围路线已逐渐获得资本市场认可,完成了多轮融资,研发人员占比超过80%。今年7月,企业还将启动新一轮融资,用于芯片迭代和高端人才扩充。
在沟通会上,算苗科技CEO汪福全与媒体围绕3D堆叠技术、国产算力突围、量产商业化落地等话题展开了深入讨论。当被问及A4E流片对国内AI算力行业的意义时,汪福全表示,过去国内高端算力芯片受制于海外先进制程和HBM内存供货,或依赖传统2D GPU架构,始终无法突破“内存墙”。而A4E依托国产成熟制程和本土供应链体系完成3D混合堆叠流片,证明了无需死磕顶尖先进制程,通过架构创新也能对标全球顶级云端AI芯片。
关于芯片量产时间,汪福全透露,A4E刚刚完成流片,若进度顺利,明年同期即可实现规模量产。第二代A4S计划于明年春节前后流片,整体性能将实现翻倍提升。对于算苗自研的TokenPU与英伟达GPU及市面上各类NPU的核心区别,汪福全解释道,GPU诞生于PC图像游戏时代,虽是优秀的并行处理架构,但并非为大模型时代的海量Token处理量身打造,存在能耗高、成本高、可维护性差等问题。而市面上多数NPU主要针对手机终端等轻量化场景,无法承受云端海量推理负载。TokenPU则是为大模型时代原生设计的计算架构,专为贴合AI大模型底层逻辑,对语言文本、图片、视频乃至未来世界模型的信息转化Token运算进行了全链路优化。
针对行业长期认为英伟达CUDA生态是难以逾越的壁垒这一观点,汪福全认为,过去GPU时代软件生态确实是英伟达的护城河,但如今行业底层逻辑已发生彻底变化。全球日均生成500至600万亿Token,每个Token背后都是电力和算力的消耗,单位Token使用成本已成为客户首要考量。3D堆叠技术能带来碾压级能效优势,大幅降低单Token运营成本。加之海外高端GPU采购受限且存在断供风险,国内模型企业主动拥抱国产算力的意愿增强,CUDA已不再是不可突破的壁垒,供应链稳定和极致性价比正在重新定义行业选择标准。
当被问及3D堆叠技术直击AI芯片什么痛点以及与传统技术路线相比的优势时,汪福全指出,大模型参数规模不断扩大,运算时数据需在内存和计算单元之间反复搬运,导致“内存墙”问题,芯片大半能耗和延迟都消耗在数据搬运上。传统HBM采用2.5D封装,GPU与HBM通过标准总线互联。而3D混合键合直接将存储晶圆垂直叠在逻辑芯片上方,传输距离从毫米级压缩到微米级,互联的bump与TSV数量达到上百万个,是标准总线的上千倍,从而极大改善了线宽与总线,彻底释放带宽、减少传输延迟。
针对近期市场Token价格持续走高的情况,汪福全分析道,Token涨价的核心原因是算力供给跟不上爆炸式需求,电力消耗是最大成本项。美国百万Token成本约0.6美元,国内虽电价较低但使用人口多,算力缺口持续推高服务价格。目前,3D堆叠是唯一成熟且可大规模量产落地的降本路线,其他新技术如存算一体、光计算等离产业落地和量产还较远。依托国内电力优势,等A4E大规模出货后,行业硬件和电力成本将下降。但如果Token需求增速持续超过算力扩容速度,价格仍有上涨可能。
对于国内不少企业扎堆布局3D芯片,算苗是否担心被同行追赶超越的问题,汪福全表示,国内已有一些企业入局3D设计,但从人才储备、经验积累、技术验证和供应链磨合等方面来看,算苗的壁垒很难在短期内被复制。3D堆叠资金、人才、工程落地门槛极高,且研发周期长,不太可能出现恶性内卷。
在被问及国内先进制程存在短板,依靠3D堆叠架构创新与海外高端芯片的技术代差未来三五年会如何时,汪福全认为,单纯比拼先进制程,国内短期内确实存在差距,但3D堆叠是换道超车路线。海外厂商靠先进制程叠加HBM拉高算力,而国内绕开制程短板,用立体堆叠提升访存带宽与算力密度。随着国内芯片产业链持续成熟,搭配持续创新的架构,未来完全有能力、有机会、有条件依靠创新的中国方案解决算力饥渴问题。













