近期,谷歌的人工智能领域传来了一则令人瞩目的消息:其最尖端模型在一款经典电子游戏中取得了历史性的成就。
谷歌CEO桑达尔·皮查伊在一则网络公告中难掩激动之情,宣布:“真是不可思议!Gemini 2.5 Pro已经成功征服了《宝可梦蓝》!”这一壮举是由一场名为“Gemini Plays Pokemon”的直播活动所见证的,活动发起人Joel Z,一位30岁的软件工程师,虽非谷歌员工,却得到了谷歌高层的全力支持。
据透露,早在上个月,谷歌AI Studio的产品负责人洛根·基尔帕特里克就已透露Gemini在《宝可梦》系列游戏中的卓越进展,当时它已赢得了第五个徽章,这一成绩远超同类模型,后者最佳表现仅为三枚徽章,尽管使用的是不同的代理框架。皮查伊幽默地补充道:“我们正在考虑开发一个API,专门用于‘人工宝可梦智能’。”
为何谷歌选择了《宝可梦》作为挑战对象?原来,早在今年2月,Anthropic公司就曾展示其Claude AI模型在《宝可梦红》中的不凡表现,强调其“深度思考与代理训练”的优势,尤其擅长应对游戏中的意外情况。然而,Claude似乎尚未完成《宝可梦红》的通关,这不禁让人好奇,Gemini是否在游戏能力上更胜一筹?对此,Joel Z在Twitch频道上提醒观众:“请不要将这两者的表现直接对比,因为Gemini和Claude使用了不同的工具,接收的信息也有所差异。”
值得注意的是,无论是Gemini还是Claude,它们都需要借助代理框架来玩游戏。这些框架通过提供带有额外信息的游戏截图,帮助模型做出决策,并模拟按键操作。尽管Joel Z承认在Gemini的游戏过程中进行了一些“开发性调整”,但他强调这些调整并非作弊,而是为了提升模型的决策和推理能力。“我不会给出具体提示或攻略,唯一的例外是,我曾告诉Gemini需要与火箭队小兵对话两次才能获得升空钥匙,这是一个在后续版本中已被修复的漏洞。”他解释道。
Joel Z还透露:“Gemini Plays Pokémon项目仍在紧锣密鼓地开发中,其代理框架也在不断优化和完善。”