OpenAI推出ChatGPT+Images:奥亮腹肌助阵,开启多模态新时代

编辑|Panda
如果你刚刚打开 X 并且正好关注了 OpenAI 和山姆・奥特曼,那么你可能会看到这样的照片:

是的,确实有点辣眼睛。就连 OpenAI 最新号也忍不住吐槽(其实是刷热度):sam.

而在评论区,更是一片吐槽和调侃:

但不管怎么说,热度是有了。
实际上,山姆・奥特曼之所以发这样一张辣眼睛的图片,正是为 OpenAI 刚刚推出的全新ChatGPT Images造势。而且这也不是唯一一张基于奥特曼照片改的图。OpenAI 最新号还专门单独特地发了一张这样的:

而且以身入局的 OpenAI 大佬还不止他一个。OpenAI 首席研究官 Mark Chen 和 OpenAI 总裁 Greg Brockman 都贡献了自己的照片。比如下面即是其最新博客分享的修图对话记录:

新版 ChatGPT Images
ChatGPT Images 的新版本由 OpenAI 全新的旗舰图像生成模型驱动。该公司表示:「现在,无论你是从零开始创作还是编辑照片,都能得到你脑海中构想的画面。它能在进行精准编辑的同时保持细节完好,图像生成速度更是提升了 4 倍。」
其核心特性是:精准编辑,保留关键细节
现在,当用户要求对上传的图片进行编辑时,模型能更可靠地遵循用户的意图。按 OpenAI 的说法是「细致入微到每一个小细节」,比如仅改变用户要求的部分,同时在输入、输出和后续编辑中保持光影、构图和人物外观等元素的一致性。
这能解锁很多潜在用例,比如更实用的照片编辑、更逼真的服装和发型试穿,还是保留原始图像精髓的风格滤镜和概念转换。
编辑功能
OpenAI 表示:该模型擅长各种类型的编辑,包括添加、删减、组合、融合和置换。
下面是一个从生成到各种编辑的示例。

创意转换
该模型还具备 transformation 功能,即可以改变和添加元素(如文本和布局)来实现想法,同时保留重要细节。OpenAI 表示,这些转换既适用于简单的概念,也适用于复杂的概念,并且可以通过新版 ChatGPT Images 功能中的预设风格和创意轻松尝试 —— 无需手动编写提示词。
比如,你可以将一张日常照片转换成电影海报。

或制作一张戴珍珠耳环的奥特曼。

遵循指令
OpenAI 称:「与我们的初始版本相比,该模型能更可靠地遵循指令。这不仅实现了更精准的编辑,还能处理更复杂的原始构图,按预期保留元素之间的关系。」下面给出了一个对比示例:

文本渲染
该模型在文本渲染方面又迈进了一步,能够处理更密集、更小的文本。

其他质量改进
该模型还在其他维度上进行了改进,使得输出结果能更直接地投入使用,例如渲染许多小尺寸的人脸以及提升输出结果的自然程度。

全新的创作空间
另外,OpenAI 还在 ChatGPT 中推出了全新的「Images」(图片)功能,「旨在让图像生成体验更加令人愉悦 —— 不仅能激发灵感,还能让创意探索变得毫不费力。」
用户可通过移动应用的侧边栏和 c h a tgpt.com 访问,让图像的探索和尝试变得更快、更简单。它包含了数十种预设滤镜和提示词以快速激发灵感,并会定期更新以反映新兴趋势。

可用性
全新的 Images 模型于今日起向所有 ChatGPT 用户推出,并通过 API 以 GPT Image 1.5 的形式提供。与 GPT Image 1 相比,GPT Image 1.5 的图像输入和输出价格降低了 20%,因此用户可以在预算不变的情况下生成和迭代更多图像。
ChatGPT 中全新的 Images 体验也于今日向大多数用户开放,商业版(Business)和企业版(Enterprise)的访问权限将在稍后推出。
OpenAI 表示:「我们相信,我们仍处于图像生成所能实现的可能性的开端。今天的更新是向前迈出的有意义的一步,未来还将有更多功能推出,从更细粒度的编辑到跨语言的更丰富、更详细的输出。」
结语
最后,我们也使用一个同样的提示词,简单测试对比了 ChatGPT Images 与谷歌的 Nano Banana Pro。

ChatGPT Images 的结果

Nano Banana Pro 的结果
看起来,至少在这个特定案例中,ChatGPT Images 的结果更加符合我们的指令。
综合来看,在这场 AI 生图之战中,OpenAI 此次发布的 ChatGPT Images 标志着竞争的维度正在变化:从单纯的「模型能力」转向了综合的「产品体验」。OpenAI 这一次甚至没有放出任何量化的基准测试结果!
同时,Sam Altman 亲自下场自黑虽然充满了硅谷式的幽默,但其背后的信号非常清晰:OpenAI 正在极力降低用户的心理门槛。通过推出独立的「Images」入口、预设风格滤镜以及极大幅度的降价,OpenAI 试图将图像生成从一种需要精心调试提示词的专业技能,变成一种像发推特一样简单的日常交互。
你看好 ChatGPT Images 吗?
https://openai.com/index/new-c h a tgpt-images-is-here/
https://x.com/OpenAI/status/2000990989629161873
相关攻略
作品声明:内容取材于网络阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,创作不易,感谢您的支持。谁能想到,2026年4月1日首播的《月鳞绮纪》,能把期待值拉
小屏旗舰一加 15T于近期正式发布,一加为它配备了全新的3 5倍潜望长焦以及OPPO最新的LUMO凝光影像系统,让它在拍照层面带来了不少惊喜,也让这款「小屏大魔王」具备了媲美大屏手机的影像实力。旗舰
3月29日,电视剧《冬去春来》播出至第16集。在最新的两集剧情内容当中,男主角徐胜利跟老师合著的剧本并未通过电影厂的实拍会议,暂时被搁置了。老师在安慰徐胜利的时候,讲到了这么一个故事,我想把这个桥段
我看古偶很少,《逐玉》这个剧也没有完整追过,所以下面说的不一定准。一部古偶剧的成本到底花在哪儿?演员片酬肯定是大头,然后是妆造、滤镜、后期磨皮这些必不可少,剩下的给到剧本,动作设计,场景质感。而在《
在手机影像飞速迭代的今天,我们对移动拍摄的需求早已超越“记录清晰”,更多人开始追求“随手出片”的松弛感,渴望用一部手机告别沉重的相机设备,拍出兼具质感与氛围感的照片。vivo X300s以「超好拍的
热门专题
热门推荐
微星PRO MAX系列ATX 3 1全模组电源现已于京东平台全面上市。该系列精心规划了850W、1000W与1200W三档功率规格,全线产品均严格通过80PLUS白金能效认证,为用户带来高效节能的供电体验。首发期间,850W版本售价579元,1000W版本679元,1200W版本799元,参与晒单活
行业首款集成视觉能力的AI智能耳机即将面世。光帆科技近日正式宣布,其创新产品“光帆全感AI耳机”定于5月15日全面发售。这款耳机以“全感知、主动式、个性化”为核心定位,旨在彻底革新用户与可穿戴音频设备之间的交互模式。 本质上,它颠覆了传统耳机的被动响应模式。根据官方介绍,这款AI耳机能够主动感知并理
止损是交易中控制风险的关键手段,在币安等交易平台设置止损时,主要参考市场波动率、技术分析关键位以及个人风险承受能力。合理的止损应基于对价格走势的客观判断,而非情绪化决策,同时需结合仓位管理,避免因单次止损过大而影响整体资金安全。动态调整止损位以适应市场变化,是提升交易纪律性的重要环节。
过去两年,要问大模型最习惯用什么格式交付内容,答案多半是Markdown。 原因不难理解:Markdown足够干净,没有冗余格式,复制到文档、知识库、GitHub,甚至直接粘贴到微信公众号后台,基本都不会出问题。某种程度上,它已经被公认为AI时代最理想的标记语言。 不过,随着Agent时代的到来,M
距离2026-2027年度旗舰手机的大幕拉开,大约还有四个月时间。按照惯例,届时在全球舞台上率先亮相的主流旗舰,很可能依然是苹果的iPhone 18 Pro系列。 就在昨天(5月8日),知名爆料人Jon Prosser发布了iPhone 18 Pro Max的视频渲染图,与此同时,关于该系列手机的七





