近期,一款神秘的图像生成模型在社交网络上悄然走红,引发了广泛关注。这款名为nano-banana的模型最初在LMArena平台的对战模式中被发现,尽管没有官方背景,但其惊人的效果迅速吸引了大量用户的注意。
在LMArena的盲测中,nano-banana凭借在“一致性”上的卓越表现,持续胜出,迅速成为全球AI核心用户和开发者的热议话题。用户们自发进行极限测试,分享惊艳案例,并为其创造了“一致性之王”、“Photoshop杀手”等标签。一时间,nano-banana成为了AI社区的明星模型。
随着讨论热度不断攀升,关于nano-banana真实身份的猜测也层出不穷。有外媒报道指出,多位AI研究者和爱好者推测,nano-banana可能是谷歌最新的图像生成模型。然而,谷歌方面并未立即回应这些猜测。
直到北京时间8月27日凌晨,谷歌终于正式认领了nano-banana模型,并宣布其为新推出的Gemini 2.5 Flash Image。据悉,该模型已在Gemini app、Google AI studio、Google API等平台上线,用户可以随时体验其强大的图像生成与编辑功能。
官方介绍显示,Gemini 2.5 Flash Image的核心技术亮点主要包括颠覆性的一致性、自然语言驱动的编辑以及闪电速度。在连续生成或编辑中,该模型能够保持人物身份的稳定,用户仅通过对话式指令即可实现高精度图像修改,无需复杂的专业工具。同时,图像生成与编辑的响应时间通常在1-2秒内,提供了接近实时的交互体验。
为了验证Gemini 2.5 Flash Image的实际效果,我们进行了实测。在生成Labubu手办的任务中,该模型展现了惊人的逼真度和细节处理能力,但数量上出现了小误差。不过,在多图融合任务中,Gemini 2.5 Flash Image表现出了卓越的一致性,能够准确理解并融合多张图片的信息。
我们还尝试了让模型计算数学题,结果在短时间内就得出了正确答案。这一表现进一步证明了Gemini 2.5 Flash Image的先进推理能力和理解能力。
值得注意的是,Gemini 2.5 Flash Image的出圈路线也颇具特色。从完全匿名身份出现在LMArena对战模式,到凭借实力赢得用户青睐,再到谷歌正式认领并全面推送,这一过程充分利用了社区自发传播的势能,避免了过度炒作可能带来的反噬效应。这种“神秘发布”模式为焦虑市场反馈的下一代模型们提供了一种新的发布思路。
如今,Gemini 2.5 Flash Image已成为AI领域的热门话题,其卓越的性能和独特的发布方式都为用户留下了深刻印象。未来,我们期待看到更多像Gemini 2.5 Flash Image这样优秀的模型涌现,为AI技术的发展注入新的活力。