特斯拉创始人埃隆·马斯克的人工智能公司xAI近日震撼发布了全新的人工智能大模型——Grok 4,标志着人工智能领域的一次重大飞跃。
在7月10日的发布会上,xAI通过近一个小时的直播,向全球观众展示了Grok 4系列的两款重磅产品:Grok 4(单智能体版本)与Grok 4 Heavy(多智能体版本)。其中,Grok 4 Heavy支持四个智能体并行运作,通过横向对比与纵向协同,能够调用更庞大的计算资源,应对更为复杂精细的任务。
作为xAI自2023年首推大模型以来的第四次重大更新,Grok 4在备受瞩目的“人类的最后考试”(Humanity's Last Exam)中取得了25.4%的准确率,这一成绩不仅超越了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%,更让Grok 4被誉为“全球最强AI模型”。
“Humanity's Last Exam”涵盖了数学、自然科学、工程及所有人文学科,共计2500个问题,每个问题均达到博士乃至高级研究水平,极具挑战。然而,Grok 4在这些高难度问题上均表现出色,展现出其卓越的能力。
“在所有学科领域,Grok 4的表现均超越博士水平——无一例外。”马斯克在直播中自信地表示,尽管Grok 4目前尚未实现新科学或物理定律的发现,但这只是时间问题,他坚信Grok 4将在今年内取得科学新突破。
Grok 4在GPQA、AIME25、LCB(Jan-May)、HMMT25等多项评估测试中,均超越了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等顶尖模型,进一步巩固了其行业领先地位。
业内人士指出,从Grok 2到Grok 3,再到如今的Grok 4,xAI的训练计算量实现了百倍增长。Grok 4的训练是在一个配备超过20万张H100 GPU的超级计算机集群上完成的,这一规模较Grok 3时期翻倍。更重要的是,xAI调整了训练策略,将更多算力专注于“推理能力”的训练。与Grok 2相比,Grok 4的训练量提升了整整100倍。
Grok 4所取得的卓越成就,离不开马斯克斥巨资打造的超级计算机集群的算力支持。2024年6月,xAI宣布在美国田纳西州孟菲斯建造超级计算机,以训练其人工智能大模型Grok。该系统初期配备20万个英伟达GPU,马斯克还计划最终将GPU规模扩大至100万个。该项目已投入数亿美元,未来仍需持续的资金投入。
就在一周前,xAI刚刚完成了高达100亿美元的融资,包括50亿美元的债务融资和50亿美元的股权融资。摩根士丹利在此次债务融资中担任顾问,并表示融资获得超额认购,吸引了全球投资者的积极参与。高昂的算力支出使得xAI面临巨大的成本压力,据外媒报道,xAI每月支出高达10亿美元,构建先进大模型的成本远超收入增长。
在AI大模型的激烈竞争中,融资与技术研发相辅相成。充足的资金为技术研发提供了有力保障,而技术的持续突破则为进一步的融资创造了条件。在Grok 4发布前夕,OpenAI也透露了可能于今年夏天发布GPT-5的消息。不可否认,Grok 4是xAI发展历程中的又一重要里程碑,但通往通用人工智能(AGI)的道路依然漫长且充满挑战。