马斯克Grok4挑战AI极限,竞赛节奏全面加速!

   时间:2025-07-10 22:47 来源:天脉网作者:赵云飞

马斯克亲自站台,xAI旗舰大模型Grok 4惊艳亮相

尽管面容略显疲惫,但马斯克依然亲自坐镇,为其旗下AI公司xAI的最新旗舰大模型Grok 4造势。他豪言壮语,将Grok 4誉为“宇宙最强模型”,甚至声称其智慧已超越所有领域的人类博士。

在马斯克的推崇下,Grok 4的表现也不负众望。在被誉为“人类最后的考试”中,Grok 4以38.6%的准确率脱颖而出,远超谷歌Gemini 2.5 Pro和OpenAI o3。多智能体版本Grok 4 Heavy更是达到了44.4%的准确率,若借助工具辅助,准确率可攀升至50.7%。

Grok 4的卓越表现背后,是xAI耗资巨大、历时6个月搭建的10万块H100 GPU超级算力中心。Grok 4的训练量是Grok 3的10倍,Grok 2的100倍,这种“暴力计算美学”让Grok 4在多个高难度基准测试中表现出色。

马斯克在直播中详细介绍了Grok 4的能力,强调其在人文、数学、物理、工程等学科均达到博士以上水平。在“人类最后的考试”中,Grok 4展现了强大的推理能力,减少对现有知识框架的依赖。在GPQA、美国数学邀请赛以及ARC-AGI-2测试中,Grok 4也取得了优异成绩。

除了学术上的卓越表现,Grok 4在商业场景的落地验证方面同样不俗。在名为Vending-Bench的商业模拟任务中,Grok 4经营自动售货机时平均净资产达到4684.15美元,是第二名的两倍,证明了其长期规划和多步骤推理能力。

Grok 4的创新点在于“工具原生融合”架构。与多数模型后期接入工具不同,Grok 4在训练阶段就嵌入了搜索、代码执行等工具,使其能够灵活调用资源解决复杂问题。例如,在直播演示中,Grok 4通过检索学术论文、调用模拟工具,成功生成了黑洞碰撞的可视化动态模型。

然而,尽管Grok 4表现出色,但业内人士认为其在代码、多模态、图像和视频生成等方面仍有进步空间。不过,这并未影响马斯克对Grok 4的信心。他透露,今年Grok 4还将融合有限元分析、流体动力学等工具,构建高精度物理模拟器,并通过Optimus人形机器人连接现实,让AI接受物理定律的最终检验。

马斯克还宣布了xAI的订阅计划。Super Grok Heavy月费高达300美元,较OpenAI顶级订阅贵50%。API定价同样激进,每百万token输入3美元、输出15美元。高定价背后是训练成本的陡增,但马斯克表示,模型能力已逼近当前测试极限。

马斯克所布局的自动驾驶、AI大模型、人形机器人、商业航天正逐渐形成闭环。Grok大模型作为“大脑”,驱动特斯拉自动驾驶和Optimus机器人行动决策;特斯拉车辆与机器人反馈的真实场景数据则反哺模型迭代。同时,SpaceX星链提供全球低延迟通信,支撑实时AI交互。

然而,高调背后也暗藏风险。近期,Grok因发表不当言论而遭到封禁和投诉,迫使xAI紧急调整审核策略。在追求AI真理的路上,如何在开放性与安全性间平衡,成为马斯克等AI领域领导者必须面对的问题。

在直播中,马斯克表示:“安全是最重要的事,我们需要确保AI是一个好AI。就像超级天才的孩子,它最终会比你聪明,但我们仍然要灌输正确的价值观。”

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报