Gemini 2.5 Pro新版登顶,安全性却遭挑战,谷歌AI再陷争议?

   时间:2025-06-06 09:50 来源:天脉网作者:沈如风

谷歌近日宣布,其人工智能模型Gemini 2.5 Pro迎来了新版本更新,代号为0605。此次更新在多个方面带来了显著提升,引发业界广泛关注。

据谷歌官方消息,新版本0605在代码编写、逻辑推理等任务上的表现更加出色。在极具挑战性的“人类最后的考试”数据集中,Gemini 2.5 Pro 0605以21.6%的成绩超越了竞争对手o3,显示出强大的实力。同时,在大型语言模型竞技场中,新版Gemini也超越了自身,Elo评分比上个月的版本提高了24分。

谷歌CEO皮查伊通过一张AI合成的狮子照片,并配以“Gemini”字样,暗示了新模型的卓越能力。谷歌AI Studio产品负责人Logan表示,这次更新预计将成为Gemini 2.5 Pro的长期稳定版本。

值得注意的是,在发布后仅十多个小时,Logan就通过推特暗示了更多信息,仅发布了一个“Gemini”的词汇,引发了外界对后续更新的期待。谷歌方面表示,Gemini APP中的模型将很快更新为该版本,开发者版本也已在谷歌AI Studio和Vertex AI中上线。

在多个基准测试中,Gemini 2.5 Pro 0605均表现出色。在“人类最后的考试”中,其成绩领先o3 1.3个百分点,远超Claude 4 Opus的两倍。在GPQA测试中,0605的成绩同样超越了几家主要竞争对手,且单次尝试的准确率高于Claude和Grok多次尝试的结果。在数学竞赛和编程方面,虽然0605稍逊于OpenAI的模型,但在代码编辑能力上处于领先地位。

0605在长文本处理方面也表现出色,在128k长度上的表现位居前列,并且是唯一支持1M长度的模型。在事实性测试FACTS Grounding中,0605更是领先第二名超过10个百分点。价格方面,Gemini也更具竞争力,输入Token价格是o3的1/8,输出Token价格是o3的1/4,远低于其他竞争对手。

然而,尽管0605在多个方面表现出色,但也并非没有争议。有用户认为,在某些指标上,如编程的LiveCodeBench和Swe-Bench,以及长文本处理方面,0605相比早期版本0325有所退步。0605的安全性也引发了关注,在官宣后仅两个小时,就被宣布成功实施了越狱攻击。

尽管如此,Gemini 2.5 Pro 0605的发布仍然标志着谷歌在人工智能领域的又一次重要突破。随着技术的不断进步和应用的不断拓展,Gemini有望在未来发挥更加重要的作用。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报