先说几个关键信息:谷歌DeepMind又给图像生成赛道添了新选项。
7月1日发布的消息,Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发,实际上它的技术代号是Gemini 3.1 Flash Lite Image,属于Gemini 3.1家族。最大的卖点就两个:快,便宜。默认模式下,输出一张图片大约4秒就能完成;而标准版Nano Banana 2生成同类图片需要20秒左右。谷歌自己说,这是迄今为止速度最快、成本最低的图像模型。

便宜和快速,是拿精细度换来的
定价上,Nano Banana 2 Lite的API走的是接地气路线:输入每百万tokens只要0.25美元,文本和推理输出每百万tokens 1.50美元;图片输出则按每百万tokens 30美元计费。换算下来,生成一张1K图像的成本大约是0.0336美元,也就是大约0.23元软妹币。相比之下,标准版Nano Banana 2的同类图像成本约为0.067美元,几乎是两倍;而定位更高端的Nano Banana Pro则要0.134美元,差不多是Lite版的四倍。
这个定价策略背后的定位很清楚:它不是给人花时间慢慢打磨一张成片的产品,而是服务于快速出图、批量生成候选方案、做原型设计和跑创意测试。对于设计师、营销团队以及需要大量配图的产品团队来说,4秒和20秒的差别,很可能就是一次试错是否继续做下去的分水岭。
当然,便宜和快速也是有边界的。Ars Technica的测试提醒,Lite版更适合快速草图和批量试错。一旦图片里出现了小号文字、价格、数据说明,或者需要同一角色在多张图中保持高度一致性,还是得用更高端的模型,甚至人工复核。另外,所有生成的图片都会带有SynthID隐形水印。
它更适合草图,不适合最终物料
如果只是想快速看看一个广告画面、活动海报或者产品页面配图大概长什么样,Nano Banana 2 Lite的优势就非常突出。它把“多试几版”的成本降到了极低的水平,也让电商页面、聊天应用等场景中的动态配图更容易落地。
不过,一旦图片里涉及价格、数据、说明文字,或者品牌方需要同一个人物、同一套产品视觉在多张图里保持一致性,Lite版就不应该被当成最终交付工具。这种场景下,还是老老实实上更可靠的模型。
视频生成也进入API和AI Studio
同一篇公告也提到了视频方面的更新:谷歌把Gemini Omni Flash视频生成与编辑能力开放到了Gemini API和Google AI Studio。这个模型曾在今年5月的Google I/O大会上亮过相,之前在Gemini App和Google Flow里也已出现。
这意味着,这次更新不是只加了一个低价生图模型,而是把“先快速生成图片,再把图片变成视频”的整条链路往开发者平台里放。对于普通用户来说,变化会先体现在更快、更便宜的图片和视频应用里;而对于创作者和营销团队来说,真正需要盯住的,仍然是错误文字、错误数据和角色跑偏这些老问题。
