OpenAI最新发布的GPT-5.2模型引发了科技圈的广泛关注。这款被寄予厚望的AI系统在基准测试中展现出惊人实力,几乎全面超越了Gemini 3 Pro,尤其在处理电子表格、PPT制作、代码编写与审查等经济价值任务方面表现突出。官方数据显示,该模型在GDPval等专业基准测试中,有70.9%的场景能达到或超越人类专家水平。
然而产品上线初期却出现意外状况。有用户在社交平台X上发帖称,当询问"garlic"中包含多少个字母"R"时,系统错误地返回"0个"的结果。这一现象被指与大语言模型的token化处理机制有关,属于底层技术局限。不过当用户强制切换至Thinking版本后,模型立即给出了正确答案。更有趣的是,部分用户反映模型性能在发布数小时后出现波动,有人调侃"喝完咖啡回来就变笨了",这种异常表现引发了对OpenAI技术策略的猜测。
技术社区的深度测试进一步验证了模型的进步。开发者构建的智能体系统显示,GPT-5.2能无缝调用多种工具且不会迷失方向,其多步骤任务处理能力获得特别称赞。在ARC Prize的评估中,Pro版本(X-High)取得90.5%的SOTA得分,意味着AI效率在一年内提升了近390倍。有用户尝试用ASCII字符描绘内心世界,模型生成的复杂图案令人震撼。
这款现象级产品的背后,活跃着多位华人科学家的身影。最早预告该模型的OpenAI研究员Yu Bai本科就读于北京大学数学系,后在斯坦福取得统计学博士学位;负责后训练的Yun Dai拥有清华大学本科和加州大学尔湾分校计算机硕士学位;推理模型团队成员Zuxin Liu则毕业于北京航空航天大学,并在卡内基梅隆大学完成硕博学业。这些技术精英的贡献,为OpenAI在AI竞赛中保持领先提供了重要支撑。













