当前位置: 首页 > 科技 > 文章内容页

谷歌Gemini 2.5 Flash升级AI修图,多项性能超越GPT-4o

时间:2025-08-28    作者:游乐小编    

8月27日消息,科技媒体The Decoder于昨日(8月26日)发布博文称,谷歌DeepMind推出了新一代Gemini 2.5 Flash图像编辑模型。该模型集成于Gemini应用中,用户可通过文字指令对图像进行高精度修改,同时保持人物或动物的外观一致性。

据博文介绍,与之前的原生图像生成工具相比,Gemini 2.5 Flash在基于文字修改图像方面表现出更高的准确性,甚至在多项任务中超越了ChatGPT所使用的GPT-4o模型,使其能够更出色地完成复杂文本驱动的图像编辑。

新模型的一大亮点是其“角色一致性”功能。在生成多张图像时,即便人物的姿态、背景环境或光照条件发生变化,模型仍能保持同一人物、动物或物体的外观特征不变。这一特性尤其适合用于创作系列照片、多角度产品展示,可为品牌素材和产品目录的批量制作提供便利。

Gemini 2.5 Flash支持精准的局部文本编辑,用户无需手动框选区域,即可实现背景虚化、瑕疵修复、色彩添加或物体移除等操作。

该模型还具备多图像融合能力,可一次性合并最多三张图像,例如将产品图像与室内场景结合生成逼真的视觉效果。此外,“风格迁移”功能支持将某种纹理、色彩或图案应用到另一物体上,同时保持其原有形状与细节。“现实推理”能力则可模拟简单因果关系,例如呈现气球飞向仙人掌及其后续情景。

目前,Gemini 2.5 Flash已在Gemini应用中正式上线。用户需将模型切换至“Flash”模式方可使用图像编辑功能,所有生成的图像均会附带可见水印及不可见的SynthID数字水印。

开发者现可通过Gemini API、Google AI Studio及Vertex AI平台体验该模型,其定价为每百万输出token 30美元,单张图像的处理成本约为0.039美元。

热门推荐

更多

热门文章

更多

首页  返回顶部

本站所有软件都由网友上传,如有侵犯您的版权,请发邮件youleyoucom@outlook.com