谷歌在北京时间2月27日凌晨发布了Gemini 3.1 Flash Image(Nano Banana 2),这是继去年8月首代产品和11月Pro版本之后的又一次重要更新。
新模型在性能与成本之间找到了新的平衡点,标志着生成式AI在商业化应用中迈出关键一步。
从性能指标看,Nano Banana 2表现突出。
独立测评机构Artificial Analysis的数据显示,该模型以Nano Banana Pro一半的价格在文生图榜单中排名第一,在图像编辑榜单中排名第三。
大模型竞技场LMArena的最新排行榜也确认了这一成绩,Nano Banana 2的文生图测试得分达到1280,超越了GPT Image 1.5和Nano Banana Pro。
价格优势成为这一版本的核心竞争力。
在谷歌AI Studio平台上,Nano Banana 2生成每张1000像素图片的单价为0.067美元,输入价格为0.5美元,而Nano Banana Pro的对应价格分别为0.134美元和2美元。
这意味着用户可以以更低的成本获得相当甚至更优的生成效果,大幅降低了AI图像生成工具的使用门槛。
技术创新方面,Nano Banana 2在多个维度实现了升级。
模型融合了Gemini对世界的理解能力,结合网络搜索的实时信息和图像数据,使生成内容更贴近现实。
在视觉表现上,模型能够呈现更生动的光照效果、更丰富的纹理细节和更清晰的画面质感。
文本渲染和多语言翻译功能的增强,使其在国际化应用中具有更大潜力。
谷歌为展示新功能开发了两个演示应用。
"靠窗座位"程序允许用户指定全球任意地点和窗户位置,模型可根据实时天气数据生成逼真的窗外景象。
"全球广告本地化器"则能将英文广告图像翻译成多种语言版本,为出海企业的国际化运营提供便利。
这些应用场景的推出,反映了谷歌对AI生成工具实用价值的深入思考。
然而,实际应用中仍存在明显局限。
在用地图截图生成特定地点全景图的测试中,Nano Banana 2虽然保持了一定的审美水准,成功还原了广州塔、猎德大桥等标志性景点,但在地理位置准确性和中文字体标注方面仍有错误。
这表明当前模型在处理复杂、精细的现实场景时,准确性和稳定性还需进一步提升。
技术革新的车轮永不停歇,Nano Banana 2的发布再次印证了数字时代的发展速度。
当机器开始触及创意领域的门槛,人类更应思考如何保持不可替代的审美判断和文化洞察。
历史经验表明,任何颠覆性技术最终都将融入产业生态,关键在于我们能否把握转型机遇,在变革中构建更具韧性的发展模式。
这场关于技术与人文的对话,才刚刚开始。