谷歌Gemini 2.5 Flash升级AI修图，多项性能超越GPT-4o

8 月 27 日消息，科技媒体 The Decoder 昨日（8 月 26 日）发布博文，报道称谷歌 DeepMind 推出全新 Gemini 2 5 Flash 图像编辑模型，在 Gemini

感谢热心网友 @乌蝇哥的左手提供的消息线索！

8月27日最新消息，科技媒体The Decoder昨日报道称，谷歌DeepMind实验室推出了全新Gemini 2.5 Flash图像生成模型。这款AI工具最大的突破在于——在Gemini应用中只需简单的文字指令，就能精准修改图片内容，同时完美保持人物面部特征和动物外貌的一致性。

据该媒体透露，相较于市面上现有的图像生成工具，Gemini 2.5 Flash在图文匹配度方面优势明显。特别是在多轮图像修改任务中，其表现甚至超越了ChatGPT采用的GPT-4o模型，使其在处理复杂图文编辑任务时更具竞争力。

https://player.bilibili.com/player.html?bvid=bv16ve6znEjK&autoplay=0&page=1</a>"" width=""100%"">

此次升级最引人注目的就是"角色一致性"技术。无论生成多少张不同场景的图片，人物的面部特征、动物的外貌都能保持惊人的一致度。这项创新特别适合需要批量制作产品宣传图、电商场景图的企业用户，为品牌视觉输出带来革命性改变。

Gemini 2.5 Flash的智能修图功能尤为强大。无需繁琐的手动选区，简单输入文字就能实现背景虚化、瑕疵修复、色彩调整等专业级后期处理效果。

更令人惊艳的是其三图融合技术，能将产品照片与实景照片无缝合成逼真的商用场景图。独特的"风格迁移"功能则可以智能套用纹理、色彩方案，同时保持主体结构的完整性。最厉害的是其因果推理能力，可以模拟气球接近仙人掌后可能发生的物理变化。

目前Gemini 2.5 Flash已正式上线Gemini应用，用户需在模型选择中切换至"Flash"版本才能使用图像编辑功能。所有生成图片都会带有可见水印和隐藏的SynthID数字水印以保护版权。

开发者现在就可以通过Gemini API、Google AI Studio及Vertex AI平台体验这项新技术。按官方定价，每百万输出token收费30美元，单张图像生成成本约为0.039美元。