首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
刚刚!ChatGPT Images 2.0突然发布,实测强得离谱

刚刚!ChatGPT Images 2.0突然发布,实测强得离谱

热心网友
38
转载
2026-04-22

还在熬夜做图的设计师们,这下真的有些尴尬了

北京时间2026年4月22日凌晨,OpenAI几乎毫无预告地扔下了一颗“重磅冲击波”——ChatGPT Images 2.0模型(下文简称Images 2.0)。对于许多设计师而言,这可能意味着一个不眠之夜。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

与之前的生图模型相比,Images 2.0的进化是全方位的:图片精度、语言支持、分辨率,乃至交互方式,都有了肉眼可见的显著提升。更关键的是,这次发布的模型,甚至被赋予了“思考”的能力。

图片来源:OpenAI

简单来说,全新登场的Images 2.0(现已集成于ChatGPT及API中)实际上包含两个分支模型:

快速模型(Instant Model):能够处理绝大多数日常任务,比如制作Logo、设计多语言海报,甚至是生成文章配图,效率极高。

思考模型(Thinking Model,需手动切换):这个模式就更有趣了。它能够主动联网查找信息,在生成图片前先进行一番逻辑推理,从而确保在一组连续输出中,画面内容和风格保持高度连贯。

口说无凭,我们直接来看效果。

下面这张照片是雷科技AWE26报道团出发前的合影,我们直接将它丢给ChatGPT,并输入需求:

图片来源:雷科技

做一本《雷科技》科技杂志的封面,封面是图片里这几个人。

不到一分钟,ChatGPT就交出了答卷。全新的Images 2.0不仅没有像许多生图AI那样把原图“重绘”得面目全非,甚至连封面上的中文字符都能准确无误地呈现。

图片来源:雷科技

但这还没完。当我们继续提出“把日期改成2026年3月”、“人物的姿势可以调整一下,现在有点死板”这类相当模糊的指令时,ChatGPT依然能准确理解并完成任务。

图片来源:雷科技

同理,只需“喂”给Images 2.0一张手机外观图,它就能直接生成这张手机在真实场景中的使用照片,毫无违和感。

图片来源:雷科技

全新的图片查看界面也带来了两项实用功能:用户可以直观地圈选图片中需要修改的区域,直接下达修改指令;还能在长宽比选单中一键切换输出比例。对于自媒体从业者来说,配图工作无疑变得更加便捷。

除了“图生图”,Images 2.0纯靠文字生成图片的能力也大幅精进。例如,仅给出“电车通马上要出发报道2026北京车展”这一句话,Images 2.0便能自行检索相关信息,生成一张要素齐全、设计合格的活动海报。

图片来源:雷科技

当然,目前它并非无所不能。尽管在OpenAI的官方演示中,Images 2.0可以正确处理二维码信息,但经过多次尝试,我们仍未能成功生成可被设备扫描识别的二维码图片。

图片来源:雷科技

从实际效果看,Images 2.0的多语言支持已经相当出色。但为了进一步测试其能力边界,我们决定给它加点“难度”:

生成一个照片风格图片:一幅毛笔书法作品在博物馆展出,上书: 北国风光,千里冰封,万&里雪飘。望长城内外,惟余莽莽;大河上下,顿失滔滔。山舞银蛇,原驰蜡象,欲与天公试比高。须晴日,看红装素裹,分外妖娆。 江山如此多娇,引无数英雄竞折腰。惜秦皇汉武,略输文采;唐宗宋祖,稍逊风骚。一代天骄,成吉思汗,只识弯弓射大雕。俱往矣,数风流人物,还看今朝。

面对如此长的文本,ChatGPT依旧在一分钟内输出了结果。可以看出,其中文字符的字体字形基本无误,但书法的笔墨“质感”仍有欠缺,整体观感更接近印刷品而非真迹。

图片来源:雷科技

“思考模型”的威力:连续推理生成漫画

说完了快速模式,再来看看需要手动开启的“思考模型”能带来什么惊喜。这次,我们直接给它布置了一道“大题”:

以上图里的形象为漫画主角,生成一部摩托车为主题的短篇漫画,篇幅至少要8页,封面和封底为彩色,其余为黑白,画风参考石森章太郎。

接到这个复杂需求后,Images 2.0会进入一个明显的“思考”阶段。点开推理详情,甚至能看到它编写对话和构思分镜的过程。这其实非常合理,因为我们完全没有提供任何剧情提示,完全交由它自由发挥。

经过大约11分钟的等待,Images 2.0成功输出了一组8张漫画。令人印象深刻的是,它不仅在这8张图中保持了画风和细节的统一(除了头盔偶尔“消失”),就连剧情也做到了上下文连贯。这种超长的连续推理与一致性控制能力,即便是其他顶尖模型也难以企及。

综合来看,Images 2.0的表现,完全可以用“一骑绝尘”来形容。

由于触发了ChatGPT Plus用户的公平使用限额,我们的体验至此暂告一段落。但就已有的测试而言,Images 2.0的能力上限显然远不止于此。

除了对中文、印地语、日语等多种亚洲语言的出色支持,以及强大的连续推理能力,根据OpenAI在直播中的演示,Images 2.0还具备在米粒上刻字的超精细制图能力,以及生成360度全景照片的本领。

图片来源:OpenAI

图片来源:OpenAI

告别“抽卡”蛮荒时代,推理能力成为核心

正是由于Images 2.0的制图效果如此出色,它的登场,某种意义上标志着AI生图正式告别了那个依赖玄学提示词、效果如同“抽卡”的蛮荒时代。

玩过Stable Diffusion等早期文生图工具的用户,应该都对那个“时代”记忆犹新:运气好时,一次就能得到理想图片;运气差时,反复调整提示词数小时,生成几百GB的“废片”也是常事,体验甚至比抽卡手游还差——毕竟手游还有保底机制。

当时,若想确保产出“有较大概率符合要求”,就不得不借助ComfyUI这类复杂工具。而其中繁琐的节点设计,某种程度上又背离了利用AI提升效率、简化工作的初衷。

但Images 2.0引入“思考模型”后,情况发生了根本改变。AI首次具备了长文本逻辑解析与时空一致性的深度推理能力。

以刚才的漫画生成任务为例,Images 2.0的工作流是:先理解场景、构思剧情、布局文字,最后才落笔成画。这种从底层逻辑出发的进化,直接攻克了AI绘画中长期存在的“文字崩坏”和“画风不统一”两大顽疾,极大地拓展了AI生产力的实用边界。

图片来源:OpenAI

可以确定的是,Images 2.0的出现,对绘画、摄影等相关行业的冲击将是深远而剧烈的。而从AI技术发展的视角看,OpenAI再次证明了一个道理:单纯提升分辨率或参数规模,并不能从根本上提升AI的工作效率与智能水平。真正的核心竞争力,在于模型的推理能力

在AI图像的新时代,OpenAI已经开了一个好头。接下来,就看Google以及国内的AI巨头们,将如何接招了。

2026第十九届北京国际汽车展览会将于4月24日至5月3日在北京‌中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)举行,本届车展以“领时代·智未来”为主题,集中展现汽车工业的更多黑科技。
比亚迪、小米、鸿蒙智行(问界等)、小鹏、蔚来、岚图等头部品牌集结,多款重磅新车首秀;地平线、Momenta、卓驭等供应商集体秀肌肉,AI大模型深度赋能,高阶智驾、动力电池、超快充技术等前沿科技集中亮相,看点拉满!
雷科技旗下「电车通」将派出报道团直击现场,以“关注电动车,更懂智能化”的专业视角,带来一线独家报道,敬请关注!

来源:https://www.163.com/dy/article/KR41N63C051100B9.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

刚刚!ChatGPT Images 2.0突然发布,实测强得离谱
科技数码
刚刚!ChatGPT Images 2.0突然发布,实测强得离谱

还在熬夜做图的设计师们,这下真的有些尴尬了 北京时间2026年4月22日凌晨,OpenAI几乎毫无预告地扔下了一颗“重磅冲击波”——ChatGPT Images 2 0模型(下文简称Images 2 0)。对于许多设计师而言,这可能意味着一个不眠之夜。 与之前的生图模型相比,Images 2 0的进

热心网友
04.22
Claude强到不敢发的Mythos,被质疑用了字节Seed技术
AI
Claude强到不敢发的Mythos,被质疑用了字节Seed技术

Claude最强“神话”模型,可能用到来自字节的技术? 这条猜测直接冲上了热搜榜。 这款被形容为“强到不敢公开发布”的Mythos模型,确实极大地刺激了人们对下一代大语言模型架构的想象空间。 社区讨论的焦点,正集中在它是否采用了“循环语言模型”(Looped Language Model)这一创新架

热心网友
04.14
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话
AI
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

新智元报道编辑:元宇【新智元导读】一个让AI像原始人一样说话的插件,在HN上一夜爆火,冲破2w星。它的核心只是一条简单粗暴的prompt:删掉冠词、客套和一切废话,号称能省下75%的输出token。

热心网友
04.07
Karpathy知识库「LLM Wiki」火爆了,全网围观讨论
AI
Karpathy知识库「LLM Wiki」火爆了,全网围观讨论

机器之心编辑部还记得前几天,AI 领域知名学者 Andrej Karpathy 做客一档节目时,半开玩笑地提到:token 用不完会让人焦虑,就像患上了某种「AI 精神病」。这句话当时听起来有点夸张

热心网友
04.07
对话特赞范凌:我亲手「杀死」了过去的自己,AI 时代所有的留恋都是负担
AI
对话特赞范凌:我亲手「杀死」了过去的自己,AI 时代所有的留恋都是负担

当所有人都能调用 AI 时,什么才是你真正的护城河?作者|周永亮编辑|郑玄「我不知道 AI 这艘船上有多少船票,但我知道,上船最重要。」特赞科技创始人兼 CEO 范凌的紧迫感,几乎一直弥漫在整场交流

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

你的代码为什么又长又乱?可能是函数没用好
业界动态
你的代码为什么又长又乱?可能是函数没用好

一、概述 每天重复相同的操作,是不是感觉有点枯燥?比如,你每天都要煮饭,得经历洗米、加水、按下煮饭键这三步。如果每次都要从头到尾念叨一遍这个过程,那可就太费劲了。 别担心,函数就是来拯救你的。在Python的世界里,函数就像一个“一键煮饭”的智能按钮。你只需要把那些重复的步骤打包成一个固定的“命令”

热心网友
04.22
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定
业界动态
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定

吃透Pandas两大“数据汇总神器”:透视表与交叉表实战指南 在数据处理的工具箱里,如果说基础的清洗、筛选是基本功,那么多维度、交叉式的数据汇总,往往就是区分新手与熟手的分水岭。面对诸如“按地区加品类统计销售额”、“分析不同省份的商品订单分布”这类需求,如果还停留在手动分组、多层循环的老路上,不仅代

热心网友
04.22
微软看了会沉默 !
业界动态
微软看了会沉默 !

TaskExplorer:不止于任务管理,这是你的Windows系统终极透视镜 说起Windows任务管理器,大家都用过。但有没有那么一瞬间,你觉得它有点……过于“高冷”?比如程序卡死了,你只能对着那个居高不下的CPU百分比干瞪眼;或者隐约感觉某个软件行为不端,却无从得知它背地里究竟在读取哪些文件、

热心网友
04.22
鲸鱼wallet大额USDC转移引发关注 欧易官网链上数据可追踪
web3.0
鲸鱼wallet大额USDC转移引发关注 欧易官网链上数据可追踪

最近,美国最大的稳定币之一USDC在加密货币市场上的动态引起了广泛关注 你猜怎么着?一份区块链监测报告最近捕捉到了一个耐人寻味的信号:某鲸鱼地址在短时间内转移了价值约1 029亿美元的USDC。没错,就是1 029亿。这种量级的资金挪动,在圈内从来都不是小事,它就像投入平静湖面的一块巨石,涟漪势必会

热心网友
04.22
我把 Redis 最复杂的数据结构拆开来了:quicklist,一个藏着三层设计哲学的「链表」
业界动态
我把 Redis 最复杂的数据结构拆开来了:quicklist,一个藏着三层设计哲学的「链表」

一、从一个「翻车」的设计说起 如果回顾Redis的早期版本,你会发现List类型的底层实现,确实是经典的双向链表(adlist)。这种结构逻辑清晰明了:每个节点独立分配内存,通过prev和next指针像珍珠项链一样串起来。 但是,这种优雅背后藏着一个“内存杀手”:极度的内存碎片化。你可以想象一下,存

热心网友
04.22