马斯克Grok-4发布，AI界新霸主？比博士生还聪明，满分通过数学竞赛-天脉财经

全球科技界翘首以盼的盛事终于落幕，埃隆·马斯克携其“世界最强”AI模型Grok 4震撼发布。这一发布不仅标志着AI技术的新里程碑，更在“人类最后考试”上，以突破50%准确率的卓越表现，引领AI进入全新纪元。

Grok 4的发布直播中，马斯克与斯坦福大学博士后吴宇怀（Tony）Wu及多伦多大学出身的2023年斯隆奖得主Jimmy Ba共同揭开了其神秘面纱。据马斯克介绍，Grok 4在训练中融入了原生工具，使其在多项基准测试中表现非凡，尤其是在“人类最后考试”上，Grok 4 Heavy版本达到了44.4%的准确率，相比之前的顶尖模型Gemini-2.5-Pro，提升近18个百分点。若测试时同时训练并融入工具，其准确率更是飙升至50.7%，远超普通人类的5%平均水平。

马斯克毫不吝啬地称赞道，Grok 4的智力已超越所有领域的博士生，甚至在未提前接触题目的情况下，也能在SAT考试中取得近乎完美的分数，GER考试也近乎满分。他还预测，最晚明年，我们就能见证Grok在物理学领域的新发现。

在发布直播中，Grok 4在其他基准测试上的表现同样令人瞩目：GPQA（研究生水平问答）得分88.9%，AIME25（美国数学邀请赛）满分，LCB（Jan-May）得分79.4%，HMMT25（数学推理）得分96.7%，以及USAMO25（美国数学奥林匹克竞赛）得分61.9%。为了直观展示Grok 4的智能水平，直播中还播放了其与ChatGPT的语音对话对比，Grok 4的表现明显更胜一筹。

Grok 4的成功并非偶然。马斯克透露，其训练量是Grok 2的100倍、Grok 3的10倍，尤其在强化学习方面投入了大量计算资源，依托xAI建设的20万卡计算集群完成。Grok 4在后训练过程中原生融入工具的策略，也极大地提升了其智能水平。这一策略使得Grok 4能够灵活调用工具完成复杂任务，如基于预测市场数据预测MLB世界大赛胜率、通过后牛顿近似模型模拟黑洞引力波碰撞等。

不仅如此，Grok 4在编程、药物发现等领域也展现出强大实力。在Live Coding Bench编程测试中几乎满分，预告未来将推出专门的快速+智能编程模型；在RKG药物基准测试中，成为唯一突破10%准确率的模型。在真实世界场景中，Grok 4同样表现出色，如在自动零售bench上排名第一，还能协助生物医疗领域筛选假设、分析数据。

马斯克还透露了Grok系列的未来规划：即将发布一个编程模型，后续多模态Agent、视频生成模型等也都在研发中。特斯拉最新固件中已偷偷加入了Grok的全功能版本，只待激活。马斯克表示，Grok将成为特斯拉的语音助手，彻底改变驾驶员与汽车的对话交互方式，并支持英语和汉语。同时，擎天柱人形机器人也将搭载Grok语音助手，作为其大脑。

如今的得分意味着Grok 4在复杂知识体系和深度思考能力上已实现明显突破，成为了AI大模型能力的新标杆。在直播中，xAI团队用“黑洞碰撞模拟计算”和“世界赛预测胜率”的问题举例，Grok 4 几乎通过可视化…

从整体趋势来看，Grok 4在扩展训练资源的同时，通过引入工具使用和链式思维，不仅提升了复杂任务的处理能力，也逐步缩小了模型智能与通用认知之间的差距。多模态能力：Grok4 在图像理解上表现依旧是有限，…

彼时，Grok-3在发布会上展现出了极其强大的推理能力、逻辑应变能力、理解极度复杂物理知识以及空间模拟能力，当时在数学、科学和编程基准测试中超越了包括Gemini与Claude、GPT-4o在内的所有大模型竞…

观典防务于2022年5月披露的《转板上市报告书》中未披露报告期内及报告期后至《转板上市报告书》签署日的对外担保事项22笔，累计担保金额为6.35亿元。此外，2022年8月至12月，观典防务通过北京银行华安…

据马斯克介绍，该模型几乎在所有学科领域都比人类研究生更聪明。 Grok-4的训练量是Grok2的100倍，且在强化学习（RL）阶段投入的算力，是市面上其他任何模型的10倍以上。【免责声明】本文仅代表作者本…

在上周六泄露的基准测试结果中，Grok 4 在 HLE（Humanities Last Exam，人类最后考试）上的标准得分是35%，使用推理技术后提高到 45%，但多数网友持质疑态度。如果让大模型在测试时…

根据聆讯资料集披露，截至最后实际可行日期，咪咕文化（一家数字娱乐公司）直接持有公司 13.62%的股份，是公司在往绩记录期内的最大客户，其收入分别占公司 2022年、2023年及 2024年总收入的 42…

如今,创始人们也将目光投向了更远的地方,期望为行业市场发展带来更多可能。诺亚就是其中的代表,在人们还在探寻诺亚汪静波去哪儿了的时候,她已将目光投向海外,开启事业发展的新篇章。但在创始人汪静波女士看来,诺亚仍然…

按照这个标准，连续十五年在榜，去年还高居第十二位的董明珠，今年落榜有几种可能：格力电器的经营遇到重大困难，董明珠个人品牌信誉遭遇重大损失，董明珠在格力集团交出了实权或退休。我们再看看董小姐的个人品牌声誉…

【环球网科技综合报道】7月10日消息，马斯克旗下X平台首席执行官琳达·亚卡里诺于周三上午宣布辞职，其任职时长为两年。亚卡里诺表示，当初与埃隆·马斯克首次谈及他对X的愿景时，便深知肩负这家公司的非凡使命是一生…

DoNews7月10日消息，在今天召开的直播活动中，埃隆・马斯克（Elon Musk）宣布推出 Grok 4，声称是全球最强 AI模型，在处理学术问题上的表现，已达到博士级别。整场发布会时长 53 分钟，…

“京东方发展到现在可以说是一个比较好的阶段，公司的LCD业务未来十年可以提供稳定的现金流和利润，公司OLED业务还在快速发展，未来资本投入也没有那么大，手上有比较充裕的现金流。”陈炎顺表示，LCD行业三年前…

红星资本局注意到，该短剧存在多处剧情、人设与现实生活中华为、小米的业务相似，如，男主角名为余程冬，他被骁米集团挖走，且专注于无人驾驶领域。 7月9日，有律师告诉红星资本局，虽然该短剧是免费播放，但如果剧情内…

2025年7月10日，财联社电——在今日举行的xAI直播活动中，特斯拉与SpaceX创始人埃隆·马斯克公开表示，其旗下人工智能公司xAI开发的聊天机器人Grok已在“大多数领域展现出超越人类的智能水平”，但当…

大湾区航空网站介绍，侯伟于今年6月获委任为大湾区航空副主席，并于7月兼任行政总裁，以接替早前辞去行政总裁一职的吴秀兰。侯伟在2018至2023年期间，曾出任香港航空董事长。曾志伟为香港著名演员及影视制作…