谷歌Nano Banana时隔四月发布新模型_AI热点日报

谷歌Nano Banana时隔四月发布新模型

类型：热点整理2026-07-02

7月1日，谷歌这边又有新动作了，一口气放出了两款生成式AI模型：图像生成模型Nano Banana 2 Lite和视频生成编辑模型Gemini Omni Flash。 ▲谷歌推出Nano Banana 2 Lite和Gemini Omni Flash（图源：X）很多关注AI的读者应该还记得，今年2

7月1日，谷歌这边又有新动作了，一口气放出了两款生成式AI模型：图像生成模型Nano Banana 2 Lite和视频生成编辑模型Gemini Omni Flash。

▲谷歌推出Nano Banana 2 Lite和Gemini Omni Flash（图源：X）

很多关注AI的读者应该还记得，今年2月谷歌推出了Nano Banana 2，主打低延迟下的高质量图像生成，还做了推理和搜索能力的强化。到了5月的I/O大会，谷歌又首次展示了Gemini Omni Flash，当时定位是原生多模态视频生成编辑模型，不过还没向开发者开放。

这次更新的节奏很明确。Nano Banana 2 Lite是初代Nano Banana的推荐替代方案，主打近实时、较高质量的图像生成——单张1K分辨率图像生成延迟约4秒，价格从0.034美元（约合软妹币0.23元）起。而Gemini Omni Flash则是首次面向开发者公开预览，支持文本、图像和视频输入，用自然语言就能做多轮视频编辑，目前支持10秒视频生成，输出价格是每秒0.10美元（约合软妹币0.68元）。

从官方公布的评测数据来看，Nano Banana 2 Lite在图像生成和图像编辑的Elo分数上略低于Nano Banana 2，但胜在速度更快、成本更低。Gemini Omni Flash在视频编辑模型的对比中，整体偏好和指令遵循两项Elo评分均排在第一，领先HappyHorse、Kling v3 Pro、Seedance 2.0等模型。

两款模型现在已经登陆Google AI Studio、Gemini API和Gemini Enterprise Agent Platform。另外，Gemini Omni Flash在Gemini app和Google Flow里也能用。

这次更新之后，一个很自然的操作路径就出来了：用户可以先用Nano Banana 2 Lite快速生成图像，再通过Gemini Omni Flash把静态图像转成还能继续编辑的视频内容。谷歌还顺手推出了Anywhere、Space Lift、Omni Product Studio等演示应用，把从自拍换地标、室内设计预览到电商视频生成这类图像到视频的工作流，给用户展示了一遍。

一、Nano Banana 2 Lite替代初代模型，速度快性价比高

谷歌的说法很直接：Nano Banana 2 Lite（gemini-3.1-flash-lite-image）是当前使用初代Nano Banana（gemini-2.5-flash-image）的推荐替代模型，在图像质量、生成速度和成本这几个维度上都有明显提升。

虽然这个模型优先强调速度，但谷歌表示它还是保留了比较稳定的提示词遵循能力、角色一致性和图中文字渲染能力。谷歌还列了一张对比表，把Nano Banana 2、Nano Banana 2 Lite和几款竞品AI图像模型放在一起比，评估维度包括图像生成和图像编辑的Elo分数、单张1K分辨率图像的生成延迟，还有对应的价格。

▲Nano Banana 2 Lite与其他图像生成模型评测对比（图源：谷歌）

具体来看，Nano Banana 2 Lite的图像生成Elo分数是1251，比Nano Banana 2的1270略低一些，但高于Flux 2 Klein 9B、Grok Imagine Image和Seedream v5 Lite这几个竞品。在图像编辑方面，Nano Banana 2 Lite得分1308，放在对照模型里属于中等水平。

速度和成本才是Nano Banana 2 Lite最突出的长板。生成一张1K分辨率图像的延迟大约4.0秒，明显比Nano Banana、Nano Banana 2和Seedream v5 Lite等模型快一截。价格方面，Nano Banana 2 Lite每张1K图像约0.034美元（约合软妹币0.23元）起，低于谷歌自家的其他图像模型，和Seedream v5 Lite的0.035美元（约合软妹币0.24元）接近，比Flux 2 Klein 9B、Grok Imagine Image稍高一点。

为了方便开发者理解整个Nano Banana产品线，谷歌还专门列了一张表，从延迟、成本、视觉质量、推理能力四个维度做了对比。

▲Nano Banana系列三款模型对比（图源：谷歌）

（1）Nano Banana 2 Lite（Gemini 3.1 Flash Lite Image）：生成速度快，主打近实时、高流量工作流；

（2）Nano Banana 2（Gemini 3.1 Flash Image）：通用型模型，在性能与成本之间找平衡，以较低延迟维持较高的生成质量；

（3）Nano Banana Pro（Gemini 3 Pro Image）：面向复杂专业场景，强调控制能力和高级推理；

（4）Nano Banana（Gemini 2.5 Flash Image）：已经被归为旧款，建议开发者升级到Nano Banana 2 Lite，追求更高的质量、更低延迟和更低的成本。

除了开发者平台，Nano Banana 2 Lite还会进入谷歌的消费端产品，包括搜索中的AI Mode、Gemini应用、NotebookLM、Google Photos、Stitch、Google Flow和Google Ads。

X上已经有部分网友测试了这款模型，反馈是Nano Banana 2 Lite的生成质量跟Nano Banana 2很接近，但速度明显更快。

▲海外网友测试Nano Banana 2 Lite（图源：X）

二、Gemini Omni Flash开放公测，支持10秒视频生成，每秒0.10美元

前阵子在I/O大会上亮相过的视频生成编辑模型Gemini Omni Flash，这次终于正式开启公开预览了。用户现在可以通过Gemini API和Google AI Studio来使用它。

▲Gemini Omni Flash根据原视频生成魔术特效（图源：谷歌）

这个模型把Gemini的多模态推理能力跟视频生成、编辑能力结合在了一起，支持从文本、图像和视频输入中生成或编辑视频，而且可以用自然语言进行多轮修改。视频输出价格是每秒0.10美元（约合软妹币0.68元），跟Veo 3.1 Fast一样。

Gemini Omni Flash的核心能力包括：对话式视频编辑、多模态参考输入、调用Gemini知识来构建视频内容，以及通过提示词让文字、图形和视频动作实现同步。

谷歌同样列出了Gemini Omni Flash与几款竞品视频编辑模型的Elo评分对比。不论是从整体表现看，还是从指令遵循能力看，Gemini Omni Flash都具备相当明显的领先优势。

▲Gemini Omni Flash与其他视频模型评测对比（图源：谷歌）

从整体偏好看，Gemini Omni Flash得分1087，排名第一，高于HappyHorse的1044、Kling v3 Pro的1020、Seedance 2.0的946和Wan 2.7的902。在指令遵循能力上，Gemini Omni Flash同样排在首位，得分1082，领先HappyHorse的1036、Kling v3 Pro的1022、Seedance 2.0的960和Wan 2.7的900。

不过，这个模型目前还有一些限制。谷歌表示，Omni Flash当前只支持10秒视频生成，后续会推出更长时长；Gemini API暂时不支持上传音频参考和场景扩展；API schema虽然可以接受最长3秒的视频参考，但模型现阶段还不能正确处理；在切换场景或做平移动作时，角色一致性也还有局限。

三、两款模型可串联使用，先快速出图再生成视频

谷歌这次同步更新图像与视频生成能力，目的很明确：用户可以先用Nano Banana 2 Lite快速出图，再通过Gemini Omni Flash把静态图像转化为可以继续编辑的视频内容。用户可以通过Interactions API保留会话历史和上下文，最多可以叠加三次连续编辑。

为了展示这个路径，谷歌还推出了几个演示应用，让用户先体验一下。

Anywhere应用可以把用户"带到"世界各地。用户上传照片后，Nano Banana 2 Lite能把图像背景换成世界知名地标，然后Gemini Omni Flash还能把生成的图像变成该地点的动画短片。

▲Anywhere根据用户照片生成动态视频（图源：谷歌）

Space Lift面向室内设计，可以根据房间照片，先用Nano Banana 2 Lite生成不同装修风格，再用Gemini Omni Flash生成动态展示视频。

▲Space Lift根据照片生成房间动态展示视频（图源：谷歌）

Omni Product Studio则可以把Nano Banana 2 Lite生成的静态图，通过Gemini Omni Flash转成电商风格的视频。

▲Omni Product Studio生成的电商视频（图源：谷歌）

结语：谷歌加速补齐可编辑视频生成能力

从这次更新可以明显感受到，谷歌在生成式媒体这条路径上，正在加速构建一个更完整的创作闭环。用户可以先快速生成图像素材，再通过自然语言把静态图像转化为可继续修改的视频内容。多轮编辑、提示词同步和多模态参考输入，成为这次更新的核心看点。

随着Nano Banana系列图像模型进一步分层，谷歌也在把类似的思路延伸到视频生成领域。这次推出视频编辑模型Gemini Omni Flash，有助于尽快收集真实应用场景和反馈，同时推动图像、视频、自然语言编辑在Gemini生态内形成更连贯的创作链路。

来源：谷歌

来源：https://www.zhidx.com/p/571273.html

谷歌

延伸阅读

补充最近整理过的热点入口。