马斯克发布最贵AI Grok 4,号称碾压博士水平,能否颠覆行业?

   时间:2025-07-10 15:47 来源:天脉网作者:柳晴雪

在科技界的万众瞩目下,埃隆·马斯克终于揭开了Grok 4的神秘面纱,这款AI产品自研发初期就备受期待。

马斯克一如既往地自信满满,不仅在发布会前放出豪言,声称Grok 4将“重塑人类知识库”,在发布会上更是直言不讳地称其为全球最聪明的AI。这一番言论,虽然熟悉且略显夸张,却也反映了马斯克对自家产品的极高期望。

尽管外界对马斯克的自我吹嘘早已见怪不怪,但不可否认的是,xAI实验室的确在AI领域取得了显著进展。网友们虽然调侃xAI员工在办公室帐篷里过夜或周末加班至深夜,但也不得不承认,该实验室的发展速度令人瞩目。

至于Grok 4是否能真正配得上“最聪明AI”的称号,还需时间验证。不过,有一点已无可争议——它成为了市面上最昂贵的AI产品之一,年订阅价格高达3000美元,这一定价策略引发了广泛讨论。

据马斯克介绍,Grok 4的训练过程分为预训练和强化学习两个阶段。从Grok 2到Grok 3,主要依赖预训练;而从Grok 3到Grok 4,则大幅增加了以推理能力为核心的强化学习训练。这一转变,使得Grok 4的计算量相比Grok 2提升了整整两个数量级,相当于增长了100倍。

Grok 4训练量对比

马斯克表示,Grok 4已在所有主要学科上超越了博士水平,虽然目前尚不具备发明新理论或提出原创技术的能力,但他相信这只是时间问题。他甚至预测,今年底Grok就可能发明新技术,明年几乎可以确定将具备发现新物理规律的能力。

更重要的是,马斯克强调Grok与人形机器人Optimus的结合将形成一个闭环推理系统,这将开启一个智能大爆炸的时代。这一愿景,无疑让人们对未来充满了期待。

Grok与Optimus结合

Grok 4分为单智能体模型和多智能体版本Grok 4 Heavy。后者支持多个智能体并行思考,能够调用更大规模的计算资源以完成更复杂、更精密的任务。在现场演示中,Grok 4 Heavy展现了其在多个场景下的强大能力,如预测MLB世界大赛冠军概率、找出团队中头像最奇怪的人等。

在基准测试中,Grok 4也交出了亮眼的答卷。在Humanity’s Last Exam(人类最后的考试)中,Grok 4在不使用任何工具的情况下得分25.4%,超过了Google Gemini 2.5 Pro和OpenAI o3。而在使用工具的情况下,Grok 4 Heavy的得分更是高达44.4%。在ARC-AGI-2视觉推理类基准测试中,Grok也创下了新纪录。

Grok 4基准测试成绩

发布后不久就有网友表示已成功“越狱”Grok-4与Grok-4-Heavy模型。越狱后的模型能力极其危险,可绕过安全机制输出敏感或非法信息。这一消息引发了业界对AI安全性的广泛讨论。

除了强大的推理能力,Grok 4还在“更像人”方面迈出了重要一步。全新的语音助手Eve不仅能够回答问题,还能表达情绪、有语调变化,甚至能现场唱歌。这一功能在发布会现场引发了热烈反响。

Eve现场唱歌

Grok 4的应用场景也十分广泛。在自动售货机商业模拟中,Grok 4不仅登顶排行榜,而且所获得的净资产是其他模型的两倍。在科研领域,Grok 4已被用于CRISPR基因研究和胸片X光分析。在金融、游戏开发等领域,Grok 4也展现出了巨大的潜力。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报