游乐游手机版
首页/AI教程/文章详情

OpenAI发布Nano Banana 奥特曼秒变男模实测

时间:2026-06-19 13:51
OpenAI发布GPT-Image-1 5图像模型,指令执行更准、编辑更精确、速度提升4倍,能精准增删改查画面元素。英文文本渲染能力提升,但中文表现仍差。ChatGPT新增图像创作入口,提供预设滤镜和提示词。API费用降低20%,适合电商等场景。

上半年GPT-4o刚出来那会儿,热度确实炸裂,奥特曼估计都在机房闻到了GPU烧焦的味道。从那以后,生图和视觉理解几乎成了所有大模型不得不标配的功能。

但到了下半年,真正抢走所有风头的,反倒是那根「香蕉」——Nano Banana。

为了把王座重新夺回来,OpenAI今天正式推出了最新的图像视觉模型:GPT-Image-1.5。这是继GPT-5.2之后,OpenAI红色警报计划里打出的又一记重拳。

先说几个核心结论:指令执行更准了、编辑更精确了、细节保留更完整了,而且速度比之前快了整整4倍。

告别「抽卡」玄学,编辑细节能力拉满

要说这次最大的升级点,那就得好好聊聊这个「精准编辑」能力了。

以前用AI改图,简直像碰上了一个听不懂人话的「托尼老师」——你就想修修刘海,它反手就能给你剃个光头。现在好了,模型终于能听懂人话了。你改哪里,它就动哪里,不瞎折腾。

光线、构图、人物特征,在输入、输出和后续编辑的整个闭环里都能保持得稳稳当当。

听起来有点抽象?直接看官方给出的示例:

先是把两个男性和一只狗合成到一张2000年代胶片风格的儿童生日派对照片中;然后添加背景里吵闹投掷东西的孩子们;再把左边的男人改成复古手绘风格,把狗变成毛绒玩具风格,右边男子和背景完全保持不变;接着给所有人换上OpenAI毛衣;最后只把狗留下,把整个画面扔进一场OpenAI的直播里……

这一套连招打下来,画面的逻辑居然没有崩掉。这说明GPT-Image-1.5不再是靠「蒙」的,而是真正理解了画面的结构,能完成增删改查这种精细操作。能改得准、稳得住,这才是今天真正的技术护城河。

再来看几个实际测试的案例。你或许看过《千里江山图》这幅传世名作,但可能还遗漏了亿点点细节。

同理可得,谁说《百骏图》里不能突然出现一只从现代穿越过来的网红柴犬Kabosu?

甚至连马斯克和扎克伯格那场没打成的笼中决斗,在GPT-Image-1.5的加持下,一次性就成功把主角换成了奥特曼。脸没崩,违和感也几乎为零。

我们要一张细节丰富、逼真写实的极端仰拍照片:马斯克坐在珠江岸边,单手搭着广州塔尖。为了体现那种巨物感,还得在他的脚边撒上一些微小的游船和游客。结果,它确实懂了什么是「比例感」。

提示词:一张细节丰富、逼真写实的极端仰拍照片,画面中的马斯克坐在珠江岸边,一只手搭在广州塔的塔尖上。为了体现巨大的体型比例,可在他的脚边加入一些微小的游船、观光游客等,2K,16:9。

终于不再画「鬼画符」,但中文表现……

相比初版图像模型,GPT-Image-1.5更擅长遵循那些复杂、细致的指令,也能更好地保持各元素之间的预设关系。

官方展示了一个6x6的网格图案例:每一行都要按指定内容布置,希腊字母、动物、物品、图标、单词……模型排列得井井有条,强迫症看了都得说声舒服。

经过实测,把线稿转成真实图片这种操作,现在也成了基本操作。

文本渲染能力也进一步提升,能更好地处理密集、小字体的内容。比如将一段Markdown格式的内容呈现为自然的报纸文章布局,内容包括GPT-5.2发布说明、性能基准对比等,格式和数字都能保持完整准确。

这个能力听起来可能不起眼,但对于需要生成海报、宣传图、信息图表的用户来说,简直就是刚需。在Nano Banana Pro出现之前,生成式AI的文本渲染一直抽象得离谱,现在终于能看了。

不过得泼盆冷水:GPT-Image-1.5的英文能力确实能打,但中文表现依然是灾难现场。让它画个「擎天柱征服火星」的中文漫画,它就能给你自创一门火星文。

又或者让它生成一张古人在墙壁上写《水调歌头》的图片,结果文字错漏百出,握笔姿势居然还是拿钢笔的手法。

好在生成速度快了4倍,这边还在画着,那边你可以同时开几个新任务,试错成本大大降低。物体知识储备也还算在线,问它往水里加盐鸡蛋会怎样,生成的图片倒是有模有样。

左为原图,右为生成的图片。提示词:如果往水中加入大量盐,生成一张图片,展示鸡蛋会发生什么。

博主@Yuchenj_UW认为,GPT-Image-1.5的生成效果大致达到了Nano Banana Pro的「专业级」水准,但「智商/推理能力」明显落后于Nano Banana Pro,尤其在数学题、物理或迷宫这类问题上表现更差。

你的下一位设计师,何必是人?ChatGPT申请出战

OpenAI这次还在ChatGPT里专门开辟了一个图像创作入口。网页和移动端的侧边栏都能看到这个新入口,里面塞满了预设滤镜和热门提示词,还会定期更新。上传一次肖像,以后张张都是你,不用反复喂图。

说实话,这个功能Nano Banana没有,但国内的生图模型早就玩烂了。某种程度上,GPT-Image-1.5也算是在摸着国内同行的石头过河。

就在刚刚,奥特曼也在社交媒体上分享了自己用GPT-Image-1.5生成的圣诞性感月历男模照片。

既然来了,我们也顺手给奥特曼换了几套皮肤:贴纸风、摇头娃娃风、素描风。预计今天过后,他又要成为互联网上最忙的男人。

有个细节很值得点赞:当你要求生成预设方案时,OpenAI会公开预设的提示词。从这一点来看,OpenAI确实挺「open」的。

除此之外,制作贺卡、创建专辑封面、修复老照片、拍摄专业求职照片等,也都是非常实用的预设方案。比如那张经典的鲁迅和泰戈尔的合照,经过修复后,效果确实挺不错。

OpenAI应用CEO Fidji Simo在博客中写道:「人类的思维并不只是由文字组成。事实上,我们最有创意的想法,往往起源于脑海中的图像、声音、动作或模式。」

她透露,ChatGPT正在从一个反应式、以文本为核心的产品,转变为一个更直观、更能贴合你各种任务需求的工具。从纯文字向多媒体和动态界面转变,是这一进化过程中非常重要的一步。

很多用户第一次接触ChatGPT,都是通过文字生成图片。但ChatGPT的聊天界面最初并不是为此设计的。图像创作和编辑是一种完全不同的任务,需要专门的视觉空间来支持。于是,OpenAI干脆给它搞了个专属入口,让图像生成有了一个更像创意工作室的环境。

OpenAI的计划还不止于此。未来还将引入更多视觉元素,优化ChatGPT的整体体验。比如在进行搜索查询时,结果将更多地包含图片和清晰来源。在单位换算或查阅体育比分等任务中,你需要的是一目了然的可视化结果,而不是一段文字描述。

甚至写作体验也在改。未来内置的写作模块让你在聊天中就能直接编辑,还能一键导出PDF或直接调用邮件应用发送。ChatGPT早已不是一款单纯的语言模型,它正在变成一个真正的多模态工作台。

当然,除了普通用户,开发者也能通过API用上GPT-Image-1.5。

相比GPT-Image-1,GPT-Image-1.5具备更强的品牌元素与关键视觉保持能力,非常适合电商、品牌营销等需要生成大量变体图片的场景。图像输入输出费用降低了20%,同样预算能生成更多图像。

降价+提效,这套组合拳打得还是挺实在的。

除此之外,迪士尼上周已经宣布向OpenAI投资10亿美元,并达成了合作协议。根据这项为期三年的授权协议,OpenAI旗下的Sora和图像生成模型都能生成迪士尼、漫威、皮克斯和星球大战旗下的角色,并计划在明年初正式上线相关功能。

内容IP加上AI生成,这背后的想象空间确实挺大。

更重要的是,GPT-Image-1.5的发布,标志着图像生成工具正在从「玩具」向「工具」转变。目前市面上大多数AI改图工具,一改就崩,毫无一致性可言。GPT-Image-1.5至少在这个方向上迈出了坚实的一步。它开始具备后期编辑能力,能像Nano Banana Pro一样控制细节,确保画面连贯。

此外,在模型能力本身还不够强的情况下,GPT-Image-1.5通过更完善的图片生成预设方案以及功能设置,来完成对新版Nano Banana的反击,确实是一个不错的选择。专属图像创作入口、预设滤镜库……这些看似不起眼的产品设计,恰恰击中了普通用户的痛点。很多人并不需要最强的模型,他们需要的是能快速上手、不用反复调教、生成结果八九不离十的工具。模型能力领先只是第一步,如何把能力转化为好用、易用、爱用的产品,才是真正的护城河所在。

来源:https://www.aiagiai.com/15701.html
上一篇AI时代品牌官网打造与存量内容激活的方法 下一篇港股国产GPU第一股IPO文件公布 成立早于摩尔沐曦
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
批处理BAT入门教程第一篇
AI教程 · 2026-07-03

批处理BAT入门教程第一篇

提供13个批处理实战技巧,覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景,可一键完成系统维护与文件管理工作,极大提升自动化操作效率和便捷性。

从零开始批处理命令For循环详解与实战案例
AI教程 · 2026-07-03

从零开始批处理命令For循环详解与实战案例

批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名; r递归搜索指定路径及其子目录中的文件; l生成数值序列; f可解析文件、字符串或命令输出,通过delims、tokens、skip、eol等选项灵活处理内容。

批评你的人是你生命中的贵人
AI教程 · 2026-07-03

批评你的人是你生命中的贵人

批评你的人往往最值得珍惜,因为他们关注你、助你成长。面对批评应包容反思,用行动改进而非辩解。接受批评是自我完善的过程,能让人少走弯路,避免重复犯错。这样的人正是生命中的贵人,值得感恩与珍惜。

测试人员角色定位与职责详解
AI教程 · 2026-07-03

测试人员角色定位与职责详解

测试人员角色经历了从找问题、保证质量到分析风险的转变,最终核心职责是提供关键信息,协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态,而非单纯把关或追求完美。

经营成功测试生涯的实用方法与策略
AI教程 · 2026-07-03

经营成功测试生涯的实用方法与策略

一、测试生涯的起点 1989年,我在田纳西大学攻读研究生时,意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择,说起来还有些戏剧性——某个早晨,教授质问我为何缺席那么多开发会议,我解释说这些会议总是安排在周末早上,对我这个第一次离家、刚入学的学生来说实在不便。结果呢?等待我的不是解聘通