在AI大模型领域,短短两年间,市场格局与行业认知已发生翻天覆地的变化。2024年初,壁仞科技联合创始人徐凌杰告别GPU市场,投身创立魔形智能,立志打造“AI Token Factory”。彼时,这一概念对大众而言尚显陌生,但到2026年,随着OpenClaw、Seedance等应用的普及,“Token经济学”迅速在行业内外走红。今年3月,中国Token日均调用量突破140万亿,同期英伟达年度盛会GTC 2026上,黄仁勋预言“未来的数据中心将演变为生产Token的工厂”,与魔形智能的愿景不谋而合。
3月底,徐凌杰在上海接受采访,深入剖析了魔形智能的目标定位与业务模式,并从“局内人”视角解读了Token工厂、Token经济学及电力出海等热点概念的深层逻辑。徐凌杰的职业生涯横跨英伟达、AMD、三星北美研究院及阿里巴巴,2019年作为联合创始人加入壁仞科技,主导产品规划与市场拓展。2024年,壁仞多款产品进入量产阶段,营收快速增长,同年9月启动上市辅导,而徐凌杰却选择在此关键节点离职创业。
谈及创业时机,徐凌杰表示:“我和联合创始人金琛观察到,AI大模型与芯片之间存在巨大发展空间。2024年我40岁,人生黄金期有限,既然预见到Token浪潮将至,便决定全力投入。”他进一步解释,两大事件让他看清趋势:一是英伟达在2024年GTC大会上发布GB200 NVL72超节点系统,集成36个Grace CPU与72个Blackwell GPU,堪称“算力巨兽”;二是2024年5月开源模型DeepSeek V2发布,通过MoE与MLA技术将推理成本降至行业最低,每百万Token成本较GPT-5降低约96%。
一边是算力通过超节点形式极致堆叠,另一边是模型通过结构创新压缩单位Token成本,供给与效率的双重跃迁使Token的工业化生产与精细化定价成为可能。徐凌杰回忆道:“当时我们意识到,V2这样的开源模型与超节点将是市场绝配。”
在壁仞科技的离职信中,徐凌杰写道:“虽暂别造芯之路,但仍将坚守智能算力赛道。”这一表述在2024年引发外界困惑,毕竟“AI三要素——算力、算法、数据”长期是行业定位的坐标系,芯片公司常被视为算力的代名词。徐凌杰将魔形智能的业务定位为“软硬件协同的AI Infra”,而非单纯的算力优化或服务器集群提供商。他强调:“算力优化是我们的能力,但我们的使命是生产高质量Token。”
当被问及“Token工厂与数据中心、智算中心的区别”时,徐凌杰借用黄仁勋的“五层蛋糕”理论解释:Token封装了能源、芯片、Infra及大模型四层,更贴近用户生活。他指出,行业叙事模式的变化源于经济效益的再分配。例如,许多公司已将Token配额纳入工程师薪酬体系,模型正被广泛应用于生产。魔形智能的核心任务是满足市场对更快、更智能、更大规模Token的需求,这需要构建更大规模的集群。
徐凌杰透露,魔形智能对标Nebius但走得更深,强调全栈自研。Nebius通过自研服务器提升稳定性,降低训练中断率,从而加快模型训练速度。他强调:“软硬件协同是关键,而非仅聚焦软件或芯片资源。”谈及衡量Token工厂的指标,徐凌杰认为应关注“单位电力产生的Token量”,这与黄仁勋提出的“每瓦Token吞吐量”理念一致。他解释,电力是量化生产效率的最佳指标,但模型参数量与计算格式(如8bits或4bits)也会影响生产效率。
对于英伟达在Token工厂领域的地位,徐凌杰给予高度评价:“英伟达仍是技术极限的追求者,其文化推动每个人向‘光速’目标迈进。”但他认为,中国公司应更注重单位性价比。针对“电力出海”概念,徐凌杰直言:“电力成本在Token总成本中占比不足10%,算力成本才是核心。当前中国算力尚无优势,这一愿景暂不现实。”













