马斯克再次语出惊人,在社交平台X上宣称,xAI公司研发的Grok 5模型就是通用人工智能(AGI),这一言论瞬间在AI领域激起千层浪。与此同时,他还公布了一份令人瞩目的路线图,计划在五月先后推出参数量达1T和1.5T的两代万亿参数模型,这标志着四大AI巨头围绕AGI的竞争已进入白热化的关键阶段。
马斯克此次的表态毫无保留,没有使用“或许”“可能”等模糊词汇,尽显其自信与果敢。他不仅放言Grok 5就是AGI,还透露了详细的模型迭代计划。5月初,xAI将推出1T参数的Grok 4.4;5月底,1.5T参数的Grok 4.5也将问世。更令人震惊的是,终极目标Grok 5正在Colossus 2超级计算集群上以6万亿参数的规模进行高强度训练,这无疑是在AI领域投下了一颗重磅炸弹。
回顾Grok系列模型的发布历程,4月17日,xAI低调上线了Grok 4.3 Beta版本,没有官方博客、技术白皮书,也没有第三方基准测试,这种行事风格颇具SpaceX的特色。仅仅一天后,马斯克就澄清,上线的Grok 4.3 Beta只是早期测试版,真正的1T参数完整版仍在训练中。如今看来,1T参数版本或许已训练完成。
从具体的时间线和模型能力来看,Grok 4.3在4月中旬上线,这个0.5T参数的Beta版已具备将复杂神经科学论文快速转化为专业PPT演示的能力,其Office插件也在开发中。而即将推出的Grok 4.4,参数量直接翻倍至1T,马斯克称其在编程能力、长上下文处理和整体性能上都将实现质的飞跃。紧接着在5月底登场的Grok 4.5,参数将进一步膨胀至1.5T,成为Grok 5的前哨站。一个月内实现从0.5T到1T再到1.5T的参数规模跨越,这在AI发展史上堪称前所未有的壮举。
然而,1.5T参数仅仅是开胃菜,真正的焦点是正在训练的Grok 5。这个拥有6万亿参数的“巨无霸”模型,依托于孟菲斯的Colossus 2超级计算集群。该集群规模惊人,配备了55万块NVIDIA GB200/GB300 GPU,总功率高达2吉瓦,足以满足一个150万人口城市的用电需求。而且,Colossus 2并非只训练Grok 5一个模型,而是同时训练7个不同规模的模型,参数量覆盖1T、1.5T、6T甚至10T。
马斯克此前在Baron Capital投资大会上曾表示,Grok 5达到AGI的概率为10%,并且这一概率还在持续上升。如今他更是直接断言,AGI的答案就是Grok 5。尽管有人认为这只是马斯克一贯的夸张风格,但回顾他的过往,他曾提出将火箭降落到海上驳船上的设想,当时也鲜有人相信,最终却成为了现实。
不过,xAI也拥有一些独特的优势。X平台每天产生6800万条推文,其提供的实时数据流是OpenAI和Anthropic梦寐以求的数据源;特斯拉车队数百万辆汽车配备的物理世界传感器数据,为迈向具身智能提供了关键支持;SpaceX在工程执行方面的高效基因,使得xAI能在122天内建成吉瓦级超算集群,这种速度在硅谷其他公司难以想象。xAI的多智能体架构演进路线也备受关注,从Grok 4.20的4智能体协作,到Grok 4.20 Heavy的16智能体系统,再到Grok 5预期的动态智能体生成和跨领域专业化,这条路线或许比单纯扩展参数更有可能触及AGI的边界。
当前,AI领域竞争激烈,四大实验室在短时间内纷纷推出万亿参数级模型,开源阵营的GLM - 5.1在某些基准上已超越闭源前沿模型,Anthropic的Claude Mythos Preview在编程赛道上取得了93.9%的SWE - bench Verified得分,这一成绩在半年前被认为是不可能实现的。五月,马斯克的Grok 4.4和4.5将陆续登场,OpenAI很可能推出GPT - 5.5进行回应,Anthropic的Opus 4.7在编程领域已占据领先地位。在这场通往AGI的激烈竞赛中,谁能率先跨越那道模糊却又真实的门槛,目前仍是未知数,但可以确定的是,所有参与者都已全力以赴。












