7月1日,谷歌官方发布重磅消息——两款全新人工智能模型正式亮相,核心目标非常明确:帮助开发者和内容创作者在多模态内容生成领域实现更高效率、更低成本。
首先介绍图像模型,名为Nano Banana 2 Lite。用四个字概括就是:快速、经济、稳定、强大。它最快仅需4秒即可完成从文本到图像的生成,单张1K分辨率图片的成本更是低至0.034美元。这意味着什么?与行业其他方案相比,这种性价比堪称颠覆性。更重要的是,它的设计初衷正是针对高并发场景和实时原型开发——换句话说,你反复试错、快速迭代的成本门槛被大幅降低。目前开发者已能通过Google AI Studio和Gemini API直接接入,后续还将逐步整合到搜索AI模式等面向消费者的产品中。
与之搭配的还有视频生成模型Gemini Omni Flash,目前已进入公开预览阶段。它支持通过自然语言指令进行交互式视频编辑,生成费用为每秒0.10美元。别小看这个定价,它意味着轻量级团队甚至个人创作者也能以相对可控的成本尝试视频生成。
更有趣的是,这两款模型可以协同工作。举个例子:你首先在Nano Banana 2 Lite中快速生成一组静态画面草图,然后直接导入Gemini Omni Flash一键转成动态视频——从创意构思到成片输出,整个开发周期被显著压缩。这才是真正的降维打击:不是单个模型强大,而是组合起来更加好用。
在安全层面,两者都建立在谷歌的安全基础设施之上,并集成了SynthID数字水印技术。也就是说,在追求效率和低成本的同时,可追溯性和透明度同样被置于重要位置。

