AI大模型挑战《宝可梦》:游戏背后的智能进化之路

   时间:2025-05-12 00:51 来源:天脉网作者:顾雨柔

在人工智能的发展历程中,让AI挑战游戏已成为一种惯例,用以展示其智能水平的飞跃。从围棋界的AlphaGo到英伟达VOYAGER在《我的世界》中的探索,每一次AI与游戏的结合都引起了广泛关注。近期,谷歌AI模型Gemini 2.5 Pro成功独立通关初代《宝可梦》,再次将这一传统推向了新的高潮,甚至引得谷歌CEO桑达尔·皮查伊和DeepMind负责人德米斯·哈萨比斯同时发文庆祝。

然而,让人惊讶的并非仅仅是AI通关《宝可梦》这一事实,而是背后的挑战与意义。初代《宝可梦》发售于1995年,以其休闲轻松著称,即便是新手也能迅速上手。那么,为何AI通关这款游戏会成为业界大事?这不得不提到“莫拉维克悖论”,即对人类来说简单的任务对AI来说可能异常复杂,反之亦然。AI在《宝可梦》中的挑战,更接近于让其拥有感知和行动能力,而非简单的策略对决。

早在今年2月,另一家AI科技公司Anthropic便尝试让旗下最新版本AI Claude 3.7 Sonnet体验初代宝可梦游戏,目标同样是通关。然而,这项实验最终以失败告终,Claude仅挑战了三个道馆,获得三枚徽章。即便是这一对人类玩家微不足道的成就,也是Claude经过一年反复迭代的结果。在此前的版本中,Claude甚至无法走出游戏最初的“真新镇”。

Claude在通关过程中遇到的难题包括:每一步决策前的漫长思考、无意义的重复探索、卡在地图死角以及反复与无帮助的路人NPC对话。这些看似“人工智障”的行为,实则反映了AI训练方式的差异。与AlphaGo等通过强化学习在特定游戏中表现出色的AI不同,Claude和Gemini这类基于大语言模型的AI并未接受特定游戏的训练,而是直接操作游戏,通过自身的感知和学习逐步掌握。

值得注意的是,尽管Claude在游戏初期遇到了诸多困难,但它却迅速理解了宝可梦复杂的属性克制系统。例如,当游戏提示电属性技能对岩石系宝可梦效果一般时,Claude迅速捕捉这一信息,并将其应用于后续配队和对战策略。这一能力展示了AI在学习和理解游戏规则方面的潜力。

更令人惊叹的是,目前的大语言模型能够将完整的思考过程同步呈现给外界。在Claude玩宝可梦时,每一步操作的决策过程都会同步显示在左侧。这不仅让外界能够清晰地看到AI的思考过程,还展示了AI在决策时的逻辑和推理能力。例如,在使用比比鸟对战小磁怪时,Claude全面分析了自己的四个技能,并最终选择了翅膀攻击,尽管其效果一般。

除了Claude,前几天通关同一版本游戏的AI Gemini也备受关注。它不仅在人类不提供任何规则信息的条件下完成了游戏,而且总操作步数约为10.6万次,远低于Claude获得第三个徽章时的21.5万步。然而,负责Gemini项目的研究人员表示,无法直接比较这两个AI,因为测试条件并非完全相同。关键在于代理执行框架的差异,它负责连接AI模型与游戏,处理输入信息并将决策转化为操作。

尽管Gemini和Claude在通关过程中表现出了一定的差异,但让AI玩宝可梦的意义并不在于对比不同AI的水平高低。更重要的是,这类游戏需要AI感知环境、理解模糊目标、进行长线规划的能力。AI必须不断接收游戏画面、理解规则,并将决策转换为操作。如果AI能够在人类没有干预的情况下通关,说明它拥有独立学习和解决现实中复杂问题的潜力。

从围棋到《宝可梦》,AI在游戏领域的挑战不仅吸引了大众关注,也代表了AI技术的发展方向:从处理单一问题的专才到能够自我学习、解决不同领域问题的通用人工智能。选择《宝可梦》作为训练游戏,或许正是因为它本身就是关于成长、选择与冒险的旅程。过去,我们在游戏中体验进化与策略;而现在,AI正在游戏中尝试理解世界的规则本身。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报