7月1日,谷歌这边又有新动作了,一口气放出了两款生成式AI模型:图像生成模型Nano Banana 2 Lite和视频生成编辑模型Gemini Omni Flash。
▲谷歌推出Nano Banana 2 Lite和Gemini Omni Flash(图源:X)
很多关注AI的读者应该还记得,今年2月谷歌推出了Nano Banana 2,主打低延迟下的高质量图像生成,还做了推理和搜索能力的强化。到了5月的I/O大会,谷歌又首次展示了Gemini Omni Flash,当时定位是原生多模态视频生成编辑模型,不过还没向开发者开放。
这次更新的节奏很明确。Nano Banana 2 Lite是初代Nano Banana的推荐替代方案,主打近实时、较高质量的图像生成——单张1K分辨率图像生成延迟约4秒,价格从0.034美元(约合软妹币0.23元)起。而Gemini Omni Flash则是首次面向开发者公开预览,支持文本、图像和视频输入,用自然语言就能做多轮视频编辑,目前支持10秒视频生成,输出价格是每秒0.10美元(约合软妹币0.68元)。
从官方公布的评测数据来看,Nano Banana 2 Lite在图像生成和图像编辑的Elo分数上略低于Nano Banana 2,但胜在速度更快、成本更低。Gemini Omni Flash在视频编辑模型的对比中,整体偏好和指令遵循两项Elo评分均排在第一,领先HappyHorse、Kling v3 Pro、Seedance 2.0等模型。
两款模型现在已经登陆Google AI Studio、Gemini API和Gemini Enterprise Agent Platform。另外,Gemini Omni Flash在Gemini app和Google Flow里也能用。
这次更新之后,一个很自然的操作路径就出来了:用户可以先用Nano Banana 2 Lite快速生成图像,再通过Gemini Omni Flash把静态图像转成还能继续编辑的视频内容。谷歌还顺手推出了Anywhere、Space Lift、Omni Product Studio等演示应用,把从自拍换地标、室内设计预览到电商视频生成这类图像到视频的工作流,给用户展示了一遍。
一、Nano Banana 2 Lite替代初代模型,速度快性价比高
谷歌的说法很直接:Nano Banana 2 Lite(gemini-3.1-flash-lite-image)是当前使用初代Nano Banana(gemini-2.5-flash-image)的推荐替代模型,在图像质量、生成速度和成本这几个维度上都有明显提升。
虽然这个模型优先强调速度,但谷歌表示它还是保留了比较稳定的提示词遵循能力、角色一致性和图中文字渲染能力。谷歌还列了一张对比表,把Nano Banana 2、Nano Banana 2 Lite和几款竞品AI图像模型放在一起比,评估维度包括图像生成和图像编辑的Elo分数、单张1K分辨率图像的生成延迟,还有对应的价格。
▲Nano Banana 2 Lite与其他图像生成模型评测对比(图源:谷歌)
具体来看,Nano Banana 2 Lite的图像生成Elo分数是1251,比Nano Banana 2的1270略低一些,但高于Flux 2 Klein 9B、Grok Imagine Image和Seedream v5 Lite这几个竞品。在图像编辑方面,Nano Banana 2 Lite得分1308,放在对照模型里属于中等水平。
速度和成本才是Nano Banana 2 Lite最突出的长板。生成一张1K分辨率图像的延迟大约4.0秒,明显比Nano Banana、Nano Banana 2和Seedream v5 Lite等模型快一截。价格方面,Nano Banana 2 Lite每张1K图像约0.034美元(约合软妹币0.23元)起,低于谷歌自家的其他图像模型,和Seedream v5 Lite的0.035美元(约合软妹币0.24元)接近,比Flux 2 Klein 9B、Grok Imagine Image稍高一点。
为了方便开发者理解整个Nano Banana产品线,谷歌还专门列了一张表,从延迟、成本、视觉质量、推理能力四个维度做了对比。

▲Nano Banana系列三款模型对比(图源:谷歌)
(1)Nano Banana 2 Lite(Gemini 3.1 Flash Lite Image):生成速度快,主打近实时、高流量工作流;
(2)Nano Banana 2(Gemini 3.1 Flash Image):通用型模型,在性能与成本之间找平衡,以较低延迟维持较高的生成质量;
(3)Nano Banana Pro(Gemini 3 Pro Image):面向复杂专业场景,强调控制能力和高级推理;
(4)Nano Banana(Gemini 2.5 Flash Image):已经被归为旧款,建议开发者升级到Nano Banana 2 Lite,追求更高的质量、更低延迟和更低的成本。
除了开发者平台,Nano Banana 2 Lite还会进入谷歌的消费端产品,包括搜索中的AI Mode、Gemini应用、NotebookLM、Google Photos、Stitch、Google Flow和Google Ads。
X上已经有部分网友测试了这款模型,反馈是Nano Banana 2 Lite的生成质量跟Nano Banana 2很接近,但速度明显更快。

▲海外网友测试Nano Banana 2 Lite(图源:X)
二、Gemini Omni Flash开放公测,支持10秒视频生成,每秒0.10美元
前阵子在I/O大会上亮相过的视频生成编辑模型Gemini Omni Flash,这次终于正式开启公开预览了。用户现在可以通过Gemini API和Google AI Studio来使用它。
▲Gemini Omni Flash根据原视频生成魔术特效(图源:谷歌)
这个模型把Gemini的多模态推理能力跟视频生成、编辑能力结合在了一起,支持从文本、图像和视频输入中生成或编辑视频,而且可以用自然语言进行多轮修改。视频输出价格是每秒0.10美元(约合软妹币0.68元),跟Veo 3.1 Fast一样。
Gemini Omni Flash的核心能力包括:对话式视频编辑、多模态参考输入、调用Gemini知识来构建视频内容,以及通过提示词让文字、图形和视频动作实现同步。
谷歌同样列出了Gemini Omni Flash与几款竞品视频编辑模型的Elo评分对比。不论是从整体表现看,还是从指令遵循能力看,Gemini Omni Flash都具备相当明显的领先优势。

▲Gemini Omni Flash与其他视频模型评测对比(图源:谷歌)
从整体偏好看,Gemini Omni Flash得分1087,排名第一,高于HappyHorse的1044、Kling v3 Pro的1020、Seedance 2.0的946和Wan 2.7的902。在指令遵循能力上,Gemini Omni Flash同样排在首位,得分1082,领先HappyHorse的1036、Kling v3 Pro的1022、Seedance 2.0的960和Wan 2.7的900。
不过,这个模型目前还有一些限制。谷歌表示,Omni Flash当前只支持10秒视频生成,后续会推出更长时长;Gemini API暂时不支持上传音频参考和场景扩展;API schema虽然可以接受最长3秒的视频参考,但模型现阶段还不能正确处理;在切换场景或做平移动作时,角色一致性也还有局限。
三、两款模型可串联使用,先快速出图再生成视频
谷歌这次同步更新图像与视频生成能力,目的很明确:用户可以先用Nano Banana 2 Lite快速出图,再通过Gemini Omni Flash把静态图像转化为可以继续编辑的视频内容。用户可以通过Interactions API保留会话历史和上下文,最多可以叠加三次连续编辑。
为了展示这个路径,谷歌还推出了几个演示应用,让用户先体验一下。
Anywhere应用可以把用户"带到"世界各地。用户上传照片后,Nano Banana 2 Lite能把图像背景换成世界知名地标,然后Gemini Omni Flash还能把生成的图像变成该地点的动画短片。
▲Anywhere根据用户照片生成动态视频(图源:谷歌)
Space Lift面向室内设计,可以根据房间照片,先用Nano Banana 2 Lite生成不同装修风格,再用Gemini Omni Flash生成动态展示视频。
▲Space Lift根据照片生成房间动态展示视频(图源:谷歌)
Omni Product Studio则可以把Nano Banana 2 Lite生成的静态图,通过Gemini Omni Flash转成电商风格的视频。
▲Omni Product Studio生成的电商视频(图源:谷歌)
结语:谷歌加速补齐可编辑视频生成能力
从这次更新可以明显感受到,谷歌在生成式媒体这条路径上,正在加速构建一个更完整的创作闭环。用户可以先快速生成图像素材,再通过自然语言把静态图像转化为可继续修改的视频内容。多轮编辑、提示词同步和多模态参考输入,成为这次更新的核心看点。
随着Nano Banana系列图像模型进一步分层,谷歌也在把类似的思路延伸到视频生成领域。这次推出视频编辑模型Gemini Omni Flash,有助于尽快收集真实应用场景和反馈,同时推动图像、视频、自然语言编辑在Gemini生态内形成更连贯的创作链路。
来源:谷歌
