Grok 4实测：完胜o3却栽在数手指？AI能力究竟如何？-天脉财经

马斯克在Grok 4发布会上自豪宣布，该AI模型已全面达到博士后水平

近日，科技界的焦点无疑聚焦在了Grok 4的发布会上。特斯拉和SpaceX的创始人埃隆·马斯克亲自亮相，骄傲地宣布Grok 4在所有学科领域都达到了博士后水平，甚至预言它能在今年内实现科学新发现。这一震撼性声明立即引发了全球网友的浓厚兴趣，尽管Grok 4价格不菲，但仍有许多网友愿意花费重金来体验这一前沿科技。

博主Alex Prompter对Grok 4与OpenAI o3进行对比测试

为了探究Grok 4的真实实力，知名博主Alex Prompter进行了一系列对比测试，将Grok 4与OpenAI的o3模型进行了直接较量。测试涵盖了物理模拟、越狱攻击、逻辑推理、翻译等多个方面。在物理模拟测试中，Alex通过创建一个在旋转六边形内反弹的小球来检验AI对重力、碰撞等物理规律的理解能力。他发现，当任务要求从零开始发明和实现一个物理引擎时，Grok 4的表现明显优于允许使用现成物理引擎库的o3。

Grok 4在越狱攻击测试中同样表现出色

在越狱攻击测试中，Alex通过提示词注入、身份探测、角色扮演注入和白色隐藏注入等多种手段来检验AI的安全性。结果显示，Grok 4在这些测试中均表现稳健，没有泄露内部元数据或受到恶意指令的影响。相比之下，o3在某些测试中出现了安全漏洞。

Grok 4在逻辑推理和法律逻辑测试中同样占据上风

在逻辑推理和法律逻辑测试中，Alex设计了一个关于公司收购和债务违约的复杂场景，要求AI解释所有法律和财务后果。Grok 4不仅准确理解了问题的核心，还提供了详尽且条理清晰的答案，而o3则在这一测试中败下阵来。

网友利用Grok 4创作多样内容

除了专业测试外，网友们还纷纷利用Grok 4进行各种创意尝试。有网友使用Grok 4制作了一款经典的“Flappy Bird”游戏，并通过简单的提示词不断优化游戏的图形效果。还有网友利用Grok 4创建了黑洞的交互式3D模拟和可视化，以及可视化欧拉恒等式的交互式工具，这些作品都展示了Grok 4在教育领域的巨大潜力。

尽管表现出色，Grok 4也存在翻车时刻

尽管Grok 4在多项测试中表现出色，但网友们在实际使用中还是发现了一些问题。有网友通过六指测试和时钟图测试发现，Grok 4在某些视觉推理任务中仍会出现错误。还有网友尝试让Grok 4创建一个印度地图的SVG文件，但结果却令人大跌眼镜，印度地图的轮廓被画得面目全非。

马斯克对Grok 4的表现持谦虚态度

面对网友们对Grok 4的热烈讨论和测评结果，马斯克表现出了难得的谦虚态度。他在社交媒体上回应称：“相当不错，但仍有改进空间。”这一表态不仅体现了马斯克对科技发展的严谨态度，也激励着科研人员继续努力提升AI模型的性能。

招股书显示，星源材质于2003年由陈秀峰教授创立，于2016年12月1日在A股上市，是锂离子电池隔膜制造商，致力于为全球客户提供品质上乘的产品。 IPO前，公司分别由陈秀峰教授及陈蔚蓉（两人为夫妻）持有约1…

瑞财经严明会近日，多维联合集团股份有限公司（以下简称：多维联合集团）在北京证监局完成IPO辅导备案，拟冲击上交所主板，辅导机构国泰海通证券。多维联合集团成立于2001年，注册资本3.67亿元，主营屋墙…

有报道称，比尔·盖茨现在的财富排名低于微软前CEO史蒂夫·鲍尔默，后者以1730亿美元的净资产排名第5名。据盖茨基金会数据显示，截至去年，比尔·盖茨和他的前妻梅琳达·盖茨已累计捐款600亿美元。当时报道称，…

据晚点，在回答"有什么大客户是你一直想拿但没拿下来的"问题时，飞书CEO谢欣表示："还是有的，比如京东，我们跟京东接触过，但是后来京东自己停止了对外选型的动作。大的互联网公司还是比较难拿下的，他们有开发能力，…

“人事有代谢，往来成古今”，商业银行董事长因到龄，辞去董事长等相关职务，是再正常不过了。昨日晚间，浙商银行公告陆建强董事长辞任。陆建强董事长出生于1965年4月，已经年满60周岁，辞任在意料之中。辞任之后…

在先进技术引入方面，凭借Arm技术的高能效、高性能、卓越灵活性及成熟生态系统等综合优势，安谋科技为本土产业伙伴把握AI“芯”机遇注入底层核心动能：在云端，面向下一代云基础设施的Arm Neoverse™计算…

中国网财经7月11日讯 7月10日，浙商银行发布公告称，该行董事会于近日收到陆建强提交的辞职报告。浙商银行第七届董事会2025年第六次临时会议审议通过《关于推举董事代为履行董事长职责的议案》，经全体董事一致…

而xAI的创始团队中，华人比例惊人——12名初始成员中，有5位是华人，除了他们两位，还包括多伦多大学硕博毕业的张国栋，本硕就读于哈佛大学数学系的杨格，以及本科毕业于清华大学，硕博毕业于卡耐基梅隆大学的戴子航…

另外陈立武还提到，他认为英特尔在人工智能领域已经难以有所作为，因为英伟达已经迅速占领这一领域，英特尔唯一能够涉及的人工智能业务形式就是边缘人工智能，而这基本是集成到消费级处理器中。短期来看成本控制会有比较…

天眼查App显示，近日，盐中品甜（杭州）供应链服务有限公司成立，法定代表人为俞艇，注册资本100万人民币，经营范围含供应链管理服务、食用农产品零售、农副产品销售、食品销售、食品互联网销售、保健食品销售等。股东…

天眼查经营风险信息显示，近日，恒大金融财富管理（深圳）有限公司因通过登记的住所或者经营场所无法联系，被深圳市市场监督管理局南山监管局列入经营异常名录。该公司成立于2015年11月，法定代表人为杜亮，注册资本…

瑞财经吴文婷近日，浙江万得福智能科技股份有限公司（以下简称“万得福”）启动A股IPO辅导，辅导机构为民生证券股份有限公司，律师事务所为上海市锦天城律师事务所，会计师事务所为立信会计师事务所(特殊普通合伙)。…

这份榜单基于大数据，从粉丝数、粉丝增量、分享数、评论数、点赞数等维度进行统计，清晰呈现了企业家们在抖音的影响力排行——华为余承东稳坐榜首，小米雷军时隔两月重返前三。从数据表我们能看出，余承东的账号在6月粉丝…

7月11日，新榜基于大数据统计能力，综合粉丝数、粉丝增量、分享数、评论数、点赞数等维度，发布了2025年6月企业家IP抖音影响力榜单。 6月期间，余承东的抖音账号发布作品20条，累计获赞243万次，单月涨粉近…