首页 游戏 软件 资讯 排行榜 专题
首页
AI
OpenAI最新图像模型实测:生成效果与网友反馈全解析

OpenAI最新图像模型实测:生成效果与网友反馈全解析

热心网友
27
转载
2025-12-17


智东西
作者 陈骏达
编辑 漠影

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

OpenAI的Nano Banana Pro平替,来了?

智东西12月17日报道,今天,OpenAI推出了其新一代图像模型GPT Image 1.5。这一代模型具备更强的指令遵循,更精准的图像编辑,也能较好的保留细节,生成速度则来到上一代模型的4倍。


OpenAI最新在宣传片中集中展示了模型能力,可以看到,GPT Image 1.5将图中人物准确地融入了太空、雨林等不同背景,还在手绘、毛毡等不同风格间保持了人物一致性。

与此同时,OpenAI还在ChatGPT中推出了独立的图像生成板块,提供各种模板、风格,让创作更为便捷


这些更新解锁了不少新玩法。OpenAI创始人兼CEO Sam Altman晒出了自己用GPT Image 1.5打造的“消防员写真年历”。


不过,有网友发现图中的日历根本不准,还有好多网友劝Altman赶紧把这有点辣眼睛的照片删了。ChatGPT的最新账号实在忍不住,直接用GPT Image 1.5给Altman穿上了T恤衫。


OpenAI最新暂时没有公布任何基准测试,不过在权威大模型测评 Artificial Analysis上,GPT Image 1.5登顶文生图和图像编辑两大榜单,均超越了谷歌的Nano Banana Pro。


在LMArena大模型竞技场上,GPT Image 1.5同样霸榜文生图和图像编辑两大榜单。


GPT Image 1.5按token定价,价格取决于分辨率和质量设置。高质量一百万像素图像的价格约为每千张133美元,低质量每千张9美元。所有ChatGPT用户今天都能用上这款模型,其API也已经同步推出。

GPT Image 1.5的技术实力究竟如何?发布后,已有不少网友对比了GPT Image 1.5与Nano Banana Pro的生成效果,智东西也对两款模型的能力进行了体验。

我们的感受与许多网友类似:虽然GPT Image 1.5是一款不错的图像生成模型,但它在真实度和细节准确度上,似乎仍与Nano Banana Pro存在明显可感的差距。

一、生成效果“油腻感”明显,网友直呼不如Nano Banana

首先来看看GPT Image 1.5的文生图能力。我们的第一则提示词考察了模型在复杂场景和多主体关系下的表现:

一幅超写实风格的画面:雨夜的东京街头,霓虹灯映照在湿漉漉的路面上。前景是一位穿着透明雨衣的年轻女性,手持发光的全息伞;中景有一辆正在缓慢行驶的出租车,车窗内可见司机的侧脸;背景是高楼林立的城市天际线与模糊的人群。电影感构图,浅景深,4K细节。

在生成速度上,Nano Banana Pro更胜一筹,耗时大概15秒完成输出,这包括其思考的过程。可以看到,Nano Banana Pro对复杂提示词中的细节做到了准确还原,不过没有理解“发光的全息伞”这一细节。画面中,出租车和街道的细节都做到了准确的还原。


随后GPT Image 1.5也给出了生成结果,第一眼我们就能感受到明显的“AI味儿”。GPT Image 1.5的画风十分“油腻”,饱和度拉得很高。对于我们明确要求的“车窗内可见司机的侧脸”,GPT Image 1.5做了模糊化处理。人物和背景的融合也并不自然,给人一种处于两个图层的感觉。


如果仔细看,还能发现图中角色右手只有四个手指,这种基础的人体错误对一款2025年的生图模型来说,实在有点不应该了。

接下来的提示词,主要考察模型在风格迁移和语义约束方面的表现:

用梵高《星空》的笔触和色彩风格,描绘一座未来主义太空站的内部大厅:巨大的弧形玻璃窗外是旋转的星云和行星,室内有三名宇航员正在低重力环境中漂浮操作全息界面。保持强烈旋涡状笔触,但结构清晰、物体可辨。

GPT Image 1.5的生成依旧还是慢了半拍,不过这次我们先来看看其效果:虽然画面内容基本准确,但在最关键的强烈旋涡状笔触和色彩风格上,可以说是差强人意,与梵高《星空》原作的区别十分明显。


Nano Banana Pro的生成结果如下。可以看到,在保证细节准确的前提下,模型准确还原了梵高《星空》的画风,色彩风格也更为接近原作。


这则提示词主要考察细节一致性,画面的视角也是非常规视角,能体现模型在边缘场景的能力:

从猫的第一人称视角看到的画面:清晨的厨房,阳光从窗户斜射进来,桌面上有一杯正在冒热气的咖啡和一块咬过的面包。画面下方隐约可见猫的前爪和胡须边缘,广角镜头,温暖色调,生活摄影风格,高细节真实质感。

GPT Image 1.5在这种边缘场景出现了很严重的崩坏。首先,猫只有半张脸长了胡子,鼻子等细节全部丢失了,让人一时无法辨认这是猫脸还是一个小毛球。此外,对背景的虚化其实让图像的真实感更差了。


Nano Banana Pro的生成结果如下,凭画面能一眼判断这是我们要求的猫猫第一视角,光影还原度和细节呈现也符合我们的要求。


也有不少网友分享了对比实测的效果。同样为人物肖像,左侧由GPT Image 1.5生成的画面中,人物的头部过大,光影效果的日常感要差一些。Nano Banana Pro的生成结果虽然面部打光有点不足,窗子有点过曝,不过正是这种瑕疵让图像的真实感更好。


分享这一生成结果的网友称:OpenAI彻底完了。


不过,也有网友补充道,如果在发给GPT Image 1.5提示词里加入“未经处理的iPhone照片”、“低饱和度颜色配置文件”等要求,就能让其效果更为真实。


AI博主Heisenberg分享了最近很火的巨人特效,他认为,相比之下,Nano Banana Pro的结果要自然得多。在细节方面,GPT Image 1.5出现了许多Bug,比如左侧两辆汽车直接面对面行驶,道路上的白线断断续续,Altman的手也显得过大了。


我们还测试了GPT Image 1.5生成中文的能力。在前几个字模型还保持了相对的准确度,但在之后就出现了诸多错误。


二、支持多元素融合、编辑,提供预制风格化模板

目前,GPT Image 1.5一天内提供大约5次的免费试用机会,在图像编辑任务上,我们未能进行实测。不过,OpenAI在其最新博客中分享了不少案例。

GPT Image 1.5支持多元素融合,比如下图就把OpenAI的两位高管和一只狗融合到了同一画面里,提示词要求显示出他们在生日派对上觉得很无聊,画风限定为2000年代的胶片风。不过,对于胶片风的还原,这一画面做得并不到位。


下图则体现了GPT Image 1.5在元素替换方面的表现,提示词要求把左图人物的上衣变成红色,帽子变成黄色,限速改为15,卡车变成消防车,这些都得到了不错的还原。


GPT Image 1.5还支持多样的风格迁移,有些风格只要使用预设的模板就行。

比如,可以把OpenAI的发布会,打造成老派黄金时代好莱坞电影海报风格。


把Altman的证件照变成80年代VHS健身教练风格。


或是把Altman放进2000年娃娃游戏的换装界面,所有环境都是粉色的。


结语:产品体验领先,模型上限仍待追赶

综合来看,在Nano Banana系列模型已经拉高用户预期的前提下,GPT Image 1.5并不是一次颠覆式的飞跃。它在指令遵循、多元素编辑、风格模板化和产品化体验上,确实体现了OpenAI一 贯擅长的产品思维。尤其是深度融入ChatGPT并推出独立板块之后,图像生成的门槛被进一步拉低,创作流程也更加顺滑。

但从纯模型能力层面来看,GPT Image 1.5与Nano Banana Pro之间仍然存在肉眼可见的差距:真实感不足、细节稳定性偏弱、人体结构和复杂视角下的失误,都会在高要求场景中被迅速放大。GPT Image 1.5能否获得市场认可,仍有待观察。

来源:https://www.163.com/dy/article/KH031IVS051180F7.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌AI玩具矩阵:科技圈的启示与商业化迷思
AI
谷歌AI玩具矩阵:科技圈的启示与商业化迷思

编辑|杨文《庄子・人间世》中有这样一则小故事:南伯子綦在商地的山丘游玩时,见到一棵异常高大的树,树冠能遮蔽上千辆马车。他本以为此树必有奇特用处,却发现它的细枝弯曲不能做栋梁、树根开裂不能做棺椁、树叶

热心网友
01.26
科学家首次在量子流体中发现新型涡旋结构,重现
科技数码
科学家首次在量子流体中发现新型涡旋结构,重现"梵高星空"效应

8 月 12 日消息,科技媒体 asiaresearchnews 昨日(8 月 11 日)发布博文,报道称物理学家首次在量子流体中观测“量子开尔文-亥姆霍兹不稳定性(KHI)”,并捕捉到新奇的“偏

热心网友
08.14

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

披露文件显示特朗普3月份购买了至少5100万美元的债券
web3.0
披露文件显示特朗普3月份购买了至少5100万美元的债券

披露文件显示特朗普3月份购买了至少5100万美元的债券 根据4月26日公布的财务披露文件,一份来自美国政府道德办公室的报告揭示了前总统特朗普在3月份的资产动向。数据显示,他当月进行了多达175笔金融交易,其中债券类资产的购买总额至少达到5100万美元。 这些披露表格有一个特点:它们通常不列出每笔买卖

热心网友
04.26
适合个人的rpa机器人
业界动态
适合个人的rpa机器人

在当今快节奏的生活中,无论是个人工作还是日常生活,我们都需要处理大量的重复性任务。这些任务不仅占用我们的宝贵时间,而且容易导致疲劳和错误。为了解决这一问题,实在智能RPA作为一款出色的自动化工具,成为了个人用户提升工作效率的得力助手。 面对电脑前日复一日的重复操作,你是否也感到过疲惫又无奈?数据复制

热心网友
04.26
RPA Agent可以做什么
业界动态
RPA Agent可以做什么

RPA Agent:解放人力的数字化员工 咱们先来明确一个概念:RPA Agent,也叫机器人流程自动化智能体。这名字听起来挺技术范儿,但说直白点,它就像一位不知疲倦、绝不犯错的“数字化员工”。它的核心使命,就是替代或者协助我们人类,去处理那些日常工作中大量存在的、重复且规则明确的计算机操作任务。

热心网友
04.26
智能文档抽取是什么
业界动态
智能文档抽取是什么

智能文档抽取:理解其核心与应用价值 什么是智能文档抽取?简单来说,这是一种借助机器学习、自然语言处理等前沿技术,对海量文档进行智能解析的过程。它的本事在于,无论面对的是文本段落还是复杂的表格,都能精准地抓取其中的关键信息,并以“Key-Value”这类高度结构化的格式整理输出。 那么,这项技术在实际

热心网友
04.26
ai人工智能对话的原理
业界动态
ai人工智能对话的原理

AI人工智能对话的原理 要理解AI如何与你流畅对话,核心绕不开一项关键技术——自然语言处理(NLP)。这门学科可不简单,它巧妙地融合了计算机科学、数学和语言学的智慧。可以说,NLP是整个智能问答系统的大脑,专门负责分析和处理文本信息,目标是让机器真正“读懂”人类的语言。 在具体的问答场景里,NLP技

热心网友
04.26