近日,一场关于中美大模型差距的讨论在社交平台X上引发广泛关注。事件的起因是一位网友提出疑问:中美大模型差距何时能够追平?并特别提到“中国何时才能达到Fable级别?GLM-5.2肯定会缩短差距”。这一话题迅速吸引了技术圈的注意,技术爱好者Teortaxes(拥有6.5万粉丝,以深度解读DeepSeek技术闻名)率先回应。
Teortaxes对智谱的GLM-5.2进行了定位分析,认为其当前水平相当于Claude Opus 4.7-4.8(视觉理解部分除外,因智谱尚未实现全模态统一,而Opus在这方面的表现也不尽如人意)。基于此,他推断中美模型之间存在约7个月的时间差。他进一步以Mythos系列为参照,指出Mythos在2026年2月初已达到Preview级别,功能上追平或超过Opus 4.8。若按此速度推算,中国要推出“能力对标Mythos完整版”的模型,时间可能落在2026年11月至12月之间。
这一观点引发了特斯拉创始人马斯克的关注。他参与讨论后认为,中国大模型追平的时间可能会再晚一个季度,即2027年第一季度。随后,智谱创始人兼首席科学家唐杰教授回应了马斯克的判断。他仅用一句“不会那么久”暗示,以智谱为代表的国内大模型有望在更短时间内实现跨越,尤其是智谱自身可能在今年内取得重大突破。
这场隔空对话迅速点燃了评论区的热情,网友分成两派展开争论。支持者认为,GLM-5.2的迭代速度令人惊叹。例如,GLM-5.1在全球Harvey法律Agent专业领域测试中未获排名,而GLM-5.2已跻身前三,显示出智谱模型的快速进步。他们期待年底发布的GLM-6能带来更大惊喜。
另一派则持谨慎态度。他们指出,GLM-5.2目前仍缺乏跨对话的记忆能力,仅在基准测试(Benchmark)上追平意义有限。马斯克也认同这一观点,他认为中美双方可能在年底前在基准测试上缩小差距,但若以实际实用性衡量,即使到2027年第一季度也已非常了不起。他特别提到,Anthropic一直专注于提升“有用的智能”,这种能力不会直接体现在基准分数上,但会反映在商业收入中。
这场讨论也使智谱被贴上“中国版Anthropic”的标签。两家公司不仅都带有浓厚的学院派基因,注重底层创新和长期价值,在商业化路径上也颇为相似。Anthropic从B端Coding市场切入,迅速占领专业用户心智,构建了稳健的商业模式;智谱则在B端业务中表现亮眼,与Anthropic的发展轨迹高度契合。
近期,Anthropic推出最新旗舰模型Claude Fable5,却因模型降智和访问限制等问题引发争议。相比之下,智谱推出的GLM-5.2以51分登顶所有开源权重模型,大幅领先MiniMax-M3(44分)、DeepSeek V4 Pro(44分)和Kimi K2.6(43分),并采用MIT协议全量开源。这一举措不仅为智谱赢得了大量口碑,其股价也在近五个工作日内累计上涨99.81%,几乎实现翻倍。
智谱的下一步计划备受关注。唐杰教授此前曾预告,智谱将在数月内推出原生多模态模型。这一战略意义重大,因为多模态理解与构建已成为头部模型拉开差距的关键维度。例如,Kimi今年1月发布的K2.5已采用原生多模态架构;阿里Qwen3.5-Omni在3月上线,基于超过1亿小时音视频数据进行端到端预训练;GPT-4o更是在去年4月就完成了原生多模态架构的落地。唐杰强调,多模态能力是Agent真正落地的前提,而非简单的功能附加。
然而,要实现追赶Fable5的目标,国产模型仍面临重大挑战。除了在预训练阶段将模型参数推向万亿级,更关键的是在后训练阶段实现模型的自我训练和自我迭代。这场关于中美大模型差距的讨论仍在继续,而技术发展的速度或许将超出所有人的预期。












