在科技界的万众瞩目下,埃隆·马斯克终于揭开了Grok 4的神秘面纱,这款AI产品自研发初期就备受期待。
马斯克一如既往地自信满满,不仅在发布会前放出豪言,声称Grok 4将“重塑人类知识库”,在发布会上更是直言不讳地称其为全球最聪明的AI。这一番言论,虽然熟悉且略显夸张,却也反映了马斯克对自家产品的极高期望。
尽管外界对马斯克的自我吹嘘早已见怪不怪,但不可否认的是,xAI实验室的确在AI领域取得了显著进展。网友们虽然调侃xAI员工在办公室帐篷里过夜或周末加班至深夜,但也不得不承认,该实验室的发展速度令人瞩目。
至于Grok 4是否能真正配得上“最聪明AI”的称号,还需时间验证。不过,有一点已无可争议——它成为了市面上最昂贵的AI产品之一,年订阅价格高达3000美元,这一定价策略引发了广泛讨论。
据马斯克介绍,Grok 4的训练过程分为预训练和强化学习两个阶段。从Grok 2到Grok 3,主要依赖预训练;而从Grok 3到Grok 4,则大幅增加了以推理能力为核心的强化学习训练。这一转变,使得Grok 4的计算量相比Grok 2提升了整整两个数量级,相当于增长了100倍。
马斯克表示,Grok 4已在所有主要学科上超越了博士水平,虽然目前尚不具备发明新理论或提出原创技术的能力,但他相信这只是时间问题。他甚至预测,今年底Grok就可能发明新技术,明年几乎可以确定将具备发现新物理规律的能力。
更重要的是,马斯克强调Grok与人形机器人Optimus的结合将形成一个闭环推理系统,这将开启一个智能大爆炸的时代。这一愿景,无疑让人们对未来充满了期待。
Grok 4分为单智能体模型和多智能体版本Grok 4 Heavy。后者支持多个智能体并行思考,能够调用更大规模的计算资源以完成更复杂、更精密的任务。在现场演示中,Grok 4 Heavy展现了其在多个场景下的强大能力,如预测MLB世界大赛冠军概率、找出团队中头像最奇怪的人等。
在基准测试中,Grok 4也交出了亮眼的答卷。在Humanity’s Last Exam(人类最后的考试)中,Grok 4在不使用任何工具的情况下得分25.4%,超过了Google Gemini 2.5 Pro和OpenAI o3。而在使用工具的情况下,Grok 4 Heavy的得分更是高达44.4%。在ARC-AGI-2视觉推理类基准测试中,Grok也创下了新纪录。
发布后不久就有网友表示已成功“越狱”Grok-4与Grok-4-Heavy模型。越狱后的模型能力极其危险,可绕过安全机制输出敏感或非法信息。这一消息引发了业界对AI安全性的广泛讨论。
除了强大的推理能力,Grok 4还在“更像人”方面迈出了重要一步。全新的语音助手Eve不仅能够回答问题,还能表达情绪、有语调变化,甚至能现场唱歌。这一功能在发布会现场引发了热烈反响。
Grok 4的应用场景也十分广泛。在自动售货机商业模拟中,Grok 4不仅登顶排行榜,而且所获得的净资产是其他模型的两倍。在科研领域,Grok 4已被用于CRISPR基因研究和胸片X光分析。在金融、游戏开发等领域,Grok 4也展现出了巨大的潜力。