Grok 4强势登场，马斯克豪言编程超越Cursor，20万GPU助力年赚47亿美金？-天脉财经

在科技界万众瞩目的时刻，埃隆·马斯克通过其自创的X平台，向全球直播发布了一款名为Grok 4的人工智能聊天机器人新版本。这款产品的发布不仅预示着人工智能领域的又一次重大飞跃，也引发了业界的广泛讨论。

直播中，马斯克身着标志性的皮夹克，在xAI团队成员的簇拥下，详细介绍了Grok 4的强大性能。据他介绍，Grok 4在SAT和GRE等各类学科考试中均能取得近乎满分的成绩，其智能水平甚至超越了大多数博士生。马斯克坦言：“我们已经没有更多的测试题来挑战它了，现实才是最终的考验。”他还幽默地补充说，尽管Grok 4有时可能缺乏常识，且尚未能发明新技术或发现新的物理学理论，但这只是时间问题。

值得注意的是，就在发布会前夕，xAI的首席科学家Igor Babuschkin突然辞职，这无疑为这场发布会增添了一丝神秘色彩。然而，这并未影响Grok 4的惊艳亮相。在一张xAI团队成员的合照中，可以清晰地看到，该团队中超过70%的成员都是亚洲面孔。

马斯克在直播中强调，Grok 4系列包含两个版本：Grok 4和Grok 4 Heavy。这两款模型都是纯推理模型，没有非推理模式。Grok 4在“人类终极考试”中，即使在不使用任何工具和额外智能体的情况下，也取得了50.7%的得分。而配备了“深度搜索”工具的Grok 4 Heavy，则能从网络，尤其是X平台上抓取实时数据，从而在对话中直接提供最新结果。

xAI声称，在多项基准测试中，Grok 4都展现出了前沿水平。在“人类的最后考试”中，Grok 4在没有工具辅助的情况下，获得了25.4%的准确率，超过了谷歌的Gemini 2.5 Pro和OpenAI的o3。而在配备了工具后，Grok 4 Heavy的得分更是高达44.4%，远超同类模型。在ARC-AGI-1和ARC-AGI-2测试中，Grok 4也取得了优异的成绩，几乎刷新了所有商业模型的最佳成绩。

除了强大的推理能力外，Grok 4还对互联网文化有着深刻的理解。它能高精度解读meme、俚语和幽默内容，有望成为目前最“懂网络”的AI助手之一。马斯克表示，Grok 4不仅支持文本，未来还将支持图像，甚至可能支持视频处理，这将使其在多模态能力上更接近OpenAI的GPT-5o和谷歌的Gemini 2.5 Pro。

在发布之前，xAI还让独立AI基准测试与分析平台Artificial Analysis对Grok 4进行了全面测试。结果显示，Grok 4的人工智能分析智能指数达到73，领先于OpenAI的o3、谷歌的Gemini 2.5 Pro等其他顶尖模型。在编码指数和数学指数中，Grok 4也同样领先。

马斯克在直播中还提到了Grok 4在编码方面的卓越表现。他表示，将整个源代码文件复制粘贴到Grok的查询输入框中后，Grok 4就能开始自动修复代码，其性能甚至超越了现有的Cursor模型。这一功能无疑将为开发者带来极大的便利。

对于Grok 4如此强大的性能表现，xAI的研究科学家Tony Wu在直播中进行了详细解读。他指出，从Grok 3到Grok 4，团队将大量的计算资源投入到了推理和强化学习中。借助Grok 4 Heavy中新增的工具和多智能体系统，该模型在严苛的人文硕士考试基准测试中解决了超过50%的文本问题，实现了显著的飞跃。马斯克也将这一飞跃归功于大规模计算扩展，并称赞xAI的Colossus超级计算机已扩展到20万个GPU，使其在强化学习中的计算能力远超竞争对手。

Grok 4的发布在Hacker News、Reddit等平台上引发热议。网友们纷纷表示，这款新模型在人类最后的考试基准测试中的得分令人印象深刻，甚至有人预测OpenAI的新模型可能会在不久后发布，以应对Grok 4带来的挑战。

其中，毛利率45.03%，同比增17.55%，净利率-7.74%，同比减246.18%，销售费用、管理费用、财务费用总计8760.01万元，三费占营收比35.0%，同比增62.86%，每股净资产3.72元，同…

快科技7月10日消息，2025年，小米线下网络加速扩张，尤其在汽车业务的推动下，用户结构呈现显著高端化趋势，富豪及超级富豪占比大幅提升。奥维云网（AVC）数据显示，2025年3月至6月，小米线下门店新增超4…

xAI的研究人员称，Humanity’s LastExam测试极具挑战性，总共有2500个问题，包括数学、自然科学、工程以及所有人文学科，问题广泛且都是博士甚至高级研究水平，Grok 4在这些问题上可以得…

正是在吴宇怀在多伦多大学读博的时候，JimmyBa曾是他的导师之一。可以确认的是，他分别在2011年和2014年拿到多伦多大学的硕士与博士学位。张国栋，本科毕业于浙江大学，多伦多大学博士，在进入xAI之…

21世纪经济报道记者张赛男上海报道人形机器人依旧很火。从宇树科技被爆IPO计划，到智元机器人拟收购上市公司，有关人形机器人的讨论热度丝毫不减。话题的核心仍然回到着这个基本问题：人形机器人商业化的终…

据媒体报道，7月9日，科兴生物召开特别股东大会。股东投票通过了赛富基金（SAIF）提出的两项提案：罢免现任董事会成员，并选举SAIF提名的十位资深董事候选人进入董事会，尹卫东阵营占据绝大多数席位。此次董事会洗…

尽管Grok4在多模态理解（特别是图像理解和生成）方面仍存在“部分盲点”，但xAI表示，其基础模型的第七个版本（计划在几周内完成训练）将解决这一弱点，未来模型将能够像人类一样“听到和看到世界”。未来，x…

此外，发布还展示了Grok-4在编程、药物发现等领域能力。以及在马斯克忠爱的游戏领域，Grok-4现在可以设计和构建视频游戏了，包括资源获取、写代码等，只需4个小时就能完成一款第一人称射击游戏。最后，马…

如今的得分意味着Grok 4在复杂知识体系和深度思考能力上已实现明显突破，成为了AI大模型能力的新标杆。在直播中，xAI团队用“黑洞碰撞模拟计算”和“世界赛预测胜率”的问题举例，Grok 4 几乎通过可视化…

从整体趋势来看，Grok 4在扩展训练资源的同时，通过引入工具使用和链式思维，不仅提升了复杂任务的处理能力，也逐步缩小了模型智能与通用认知之间的差距。多模态能力：Grok4 在图像理解上表现依旧是有限，…

彼时，Grok-3在发布会上展现出了极其强大的推理能力、逻辑应变能力、理解极度复杂物理知识以及空间模拟能力，当时在数学、科学和编程基准测试中超越了包括Gemini与Claude、GPT-4o在内的所有大模型竞…

观典防务于2022年5月披露的《转板上市报告书》中未披露报告期内及报告期后至《转板上市报告书》签署日的对外担保事项22笔，累计担保金额为6.35亿元。此外，2022年8月至12月，观典防务通过北京银行华安…

据马斯克介绍，该模型几乎在所有学科领域都比人类研究生更聪明。 Grok-4的训练量是Grok2的100倍，且在强化学习（RL）阶段投入的算力，是市面上其他任何模型的10倍以上。【免责声明】本文仅代表作者本…

在上周六泄露的基准测试结果中，Grok 4 在 HLE（Humanities Last Exam，人类最后考试）上的标准得分是35%，使用推理技术后提高到 45%，但多数网友持质疑态度。如果让大模型在测试时…

根据聆讯资料集披露，截至最后实际可行日期，咪咕文化（一家数字娱乐公司）直接持有公司 13.62%的股份，是公司在往绩记录期内的最大客户，其收入分别占公司 2022年、2023年及 2024年总收入的 42…