首页 游戏 软件 资讯 排行榜 专题
首页
AI
OpenAI全新图像生成旗舰模型上线:全面超越Nano+Banana

OpenAI全新图像生成旗舰模型上线:全面超越Nano+Banana

热心网友
57
转载
2025-12-17

Jay 发自 凹非寺量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

OpenAI的红色预警,还在发力。

憋了大半年的图像生成模型——GPT-Image-1.5,终于发布。

最新表示,本次更新主要有四个亮点:

更严谨的指令遵循;精确编辑;细节保留;速度比以前快4倍。

感觉……这是要全面对标Nano Banana了啊。

目前的玩法也很类似。比如,将汽车颜色改为橙色。



拯救这个被烤焦的饼。



根据奶昔架、芝士汉堡等元素,做一个复古风格的餐馆广告。



指令遵守和精确编辑方面,的确比之前强了不少。

而且今天就能用上了,GPT-Image-1.5将在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5推出。

OpenAI最强图像生成模型

被谷歌一轮正面「拷打」之后,OpenAI藏了大半年的GPT-Image-1.5,终于憋不住了。

这个旗舰级图像生成模型,主打精准编辑、细节保留,图像生成速度最高提升4倍。所有改进,都指向同一个产品理念——实用性

编辑图像时,GPT-Image-1.5对指令的遵循更加严谨:光照、构图、人物外观等关键要素,能够在输入、输出及多轮编辑中保持高度一致。

例如:生成一张2000年代胶片相机风格的照片,画面中两名男子和一条狗出现在孩子的生日派对上,神情略显无聊。



在不改变原始画面结构的前提下,还可以「加戏」,邀请一群小朋友入镜捣蛋,整体风格与细节依然能保持一致。



在图像风格层面,真实感也有了明显提升。比如下面这个Prompt:

拍摄一张20世纪70年代伦敦切尔西的场景照片,画面要逼真,所有景物清晰对焦,人群密集,还有一辆公交车,车身贴着「ImageGen 1.5」的广告,广告上印有OpenAI标志和「创造你的想象」的副标题。整体风格像业余摄影作品,iPhone快照画质……

左边是新模型,右边是旧模型,差距还是挺明显。



即便是更偏创意的任务,同样能够稳定保留关键信息与人物特征。

根据这两位男士的图片,制作一张名为《Codex》的好莱坞黄金时代电影海报。演员姓名改为Wojciech Zaremba(左)和Greg Brockman(右),由奥特曼执导,菲吉·西莫制片,AGI影业出品。



创作一张深海生物在不同深度的海报,采用垂直海洋剖面图,风格为精美细致的日式动漫风格。



前段时间,Nano Banana在答题卡上写「小作文」的能力火爆全网。GPT也能实现了。

这次,GPT-Image-1.5在文本渲染上进步明显,能够处理更密集、更小字号的文字。甚至可以根据给定资料,直接把GPT-5.2的技术报告做出来了。



除了模型能力的升级,产品形态也随之调整。

OpenAI在ChatGPT中新增了专门的图片板块,内置数十种滤镜与Prompt,可通过App侧边栏或正式直接访问。

来到Benchmark环节,自然少不了「秀肌肉」。

评测机构Artificial Analysis指出,GPT-Image-1.5在文本转图像图像编辑方面中均位列第一,超过Nano Banana Pro。



不过,在更强调精细化图像编辑能力的GenAI Image Editing Showdown中,GPT-Image-1.5仍未能反超谷歌。

但值得注意的是,其指令遵守率高达90%,断层式领先



按照OpenAI的说法,该模型将于今日起面向全球所有ChatGPT用户与API用户全面开放。

定价方面,GPT-Image-1.5的API相较上一代GPT Image 1,输入与输出成本整体下降20%。

具体价格因分辨率而异:

高质量图像约为每千张133美元;低质量图像约为每千张9美元。

不得不说,这波谷歌立大功。(doge)

世界理解,还得看香蕉?

「精细编辑+降价」,OpenAI这次,看来是铁了心要把图像功能推向生产力工具。

新模型发布后,曾任微软AI副总裁、现就职于OpenAI的Sebastien Bubeck也第一时间下场,为GPT-Image-1.5站台。



但质疑也随之而来。

有网友指出,GPT-Image-1.5在「理解世界」这一层面,似乎仍不如Nano Banana:

问题太多了。左边球体中的「线」是由三个不相连的环组成,每个方程式都有错……像是在凭感觉做数学题?



对此,Sebastien Bubeck解释道:

这只是做着玩的,如果是正式海报,肯定会在此基础上迭代。



事实上,对GPT-Image-1.5世界理解能力的质疑,并非个例。

AI社区的知名「内部」人士,Jimmy Apples在评测后直言:

相比上一代提升很大,但不如香蕉聪明。



具体而言,他认为:如果只是创意性工作,影响不大;但如果是做PPT,GPT-Image-1.5给出的图片可能会有信息错误。

Nano Banana感觉更像一个世界模型。


[1]https://x.com/ArtificialAnlys/status/2001016199094948185?s=20
[2]https://x.com/SebastienBubeck/status/2001038641469194588?s=20
[3]https://x.com/apples_jimmy/status/2001053915278926228?s=20
[4]https://genai-showdown.specr.net/image-editing
[5]https://openai.com/index/new-c h a tgpt-images-is-here/

来源:https://www.163.com/dy/article/KGVI7HPR0511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

美团AI浏览器上线,如何应对龙虾截胡挑战?
科技数码
美团AI浏览器上线,如何应对龙虾截胡挑战?

AIX财经(AIXcaijing)原创作者 | 王璐编辑 | 魏佳继腾讯、阿里、百度、360、微软、谷歌、ChatGPT等国内外科技巨头推出AI浏览器后,美团也加入了战局。3月2日,美团旗下光年之外

热心网友
03.09
币圈快照是什么意思?详细解读
web3.0
币圈快照是什么意思?详细解读

快照它在不同领域和情境中具有不同的定义和应用,在区块链领域中,快照指区块链的某个特定高度或时间点的状态,它记录了在该时间点之前的所有交易和账户余额,以上的回答是对币圈快照是什么意思?的简单描述,下面小编就来为各位投资者详细解答一下这个问题

热心网友
02.28
亚马逊云科技在中国推出S3表存储服务
科技数码
亚马逊云科技在中国推出S3表存储服务

来源:美通社北京2026年1月8日 美通社 -- 亚马逊云科技宣布,通过与光环新网和西云数据的合作,在亚马逊云科技(北京)区域和亚马逊云科技(宁夏)区域推出Amazon Simple Stora

热心网友
01.08
国产开源模型的代码跑分如何超越GPT-5.1
科技数码
国产开源模型的代码跑分如何超越GPT-5.1

2026 年开年,国内量化私募九坤投资创始团队旗下的至知研究院(IQuest Research)发布了首代开源代码大模型系列 IQuest-Coder-V1。这家研究机构声称,其 40B 参数的旗舰

热心网友
01.02
OpenAI全新图像生成旗舰模型上线:全面超越Nano+Banana
AI
OpenAI全新图像生成旗舰模型上线:全面超越Nano+Banana

Jay 发自 凹非寺量子位 | 公众号 QbitAIOpenAI的红色预警,还在发力。憋了大半年的图像生成模型——GPT-Image-1 5,终于发布。最新表示,本次更新主要有四个亮点:更严谨的指令

热心网友
12.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

混音青春迷你相机快速组装方法与成就攻略详解
游戏攻略
混音青春迷你相机快速组装方法与成就攻略详解

在热门游戏《混音青春》中,特殊成就系统为玩家提供了丰富的挑战乐趣。其中,“无须说明”成就以其独特的玩法设计吸引了众多玩家——它要求你在15秒的限时内,快速完成一台迷你相机的完整组装。 无须说明成就怎么做 该成就的核心通关条件非常清晰:你需要在15秒内成功组装好迷你相机。 这个限时组装小游戏会在主线章

热心网友
05.11
欧易OKX订单撤销教程:下错单后如何快速取消与补救指南
web3.0
欧易OKX订单撤销教程:下错单后如何快速取消与补救指南

在欧易OKX交易时,下错订单是常见情况。撤销操作并非全局统一,而是分散在交易页面的不同区域。本文详细介绍了在普通交易、策略委托以及资金账户等关键页面如何找到并执行撤销操作,帮助用户在误操作后及时补救,避免不必要的损失。

热心网友
05.11
OKX交易所App安全下载指南 安卓iOS官网与浏览器下载教程
web3.0
OKX交易所App安全下载指南 安卓iOS官网与浏览器下载教程

本文详细介绍了获取欧乙官方应用的安全渠道,包括官网直接下载、应用商店搜索及版本更新入口。重点分析了安卓系统浏览器下载权限的开启方法,并探讨了不同系统版本对应用兼容性的影响。最后提供了确保下载过程稳定可靠的实用建议,帮助用户避免非官方渠道的风险。

热心网友
05.11
OKX欧易交易所开户注册教程:从实名认证到安全设置完整指南
web3.0
OKX欧易交易所开户注册教程:从实名认证到安全设置完整指南

本文详细介绍了在欧亿平台完成开户注册的全过程,涵盖账户创建、实名认证、安全设置及首次登录等关键步骤。重点阐述了实名认证的必要性与操作流程,并强调了绑定双重验证、资金密码等安全措施的重要性,旨在为用户提供一个清晰、安全的入门指引,帮助其顺利开启数字资产交易之旅。

热心网友
05.11
欧意OKX安全设置全攻略:新手入场前必学的资产保护指南
web3.0
欧意OKX安全设置全攻略:新手入场前必学的资产保护指南

本文针对欧意OKX新用户,强调安全设置是入场前首要任务。详细介绍了如何开启双重验证、管理API密钥、设置提现白名单及识别官方渠道等核心安全功能。通过分步讲解与实用建议,帮助用户建立基础安全屏障,理解平台安全逻辑,从而更安心地探索Web3世界。

热心网友
05.11