首页 游戏 软件 资讯 排行榜 专题
首页
AI
GPT-5.2字母挂图频出错,“人类专家水平”受业内质疑

GPT-5.2字母挂图频出错,“人类专家水平”受业内质疑

热心网友
68
转载
2025-12-20

12月20日消息,回顾12月11日,OpenAI正式发布了ChatGPT-5.2模型,并沿袭一贯风格将此次更新定义为一次“通用智能的重大飞跃”。官方称其为目前最适用于现实世界专业场景的模型,甚至表示这是首个在表现上达到或超越人类专家水平的版本。

当地时间12月18日,据外媒Futurism报道,一项极其基础的测试很快对上述说法提出了质疑。在实际测试中,当要求其为小学生生成一张按英文字母顺序排列的动物挂图时,结果却漏洞百出。

这一问题最早由BCA Research全球首席策略师彼得·贝雷津发现。他在11月发布的ChatGPT-5.1上提出同样的指令后,模型思考数秒后生成的内容仅包含25个字母,而标准英文字母表应为26个。

贝雷津对此调侃道:“看来还需要更多资本投入”,这影射了OpenAI已承诺在2025年投入1.15万亿美元(注:现汇率约合8.11万亿元人民币)用于硬件建设。

在测试ChatGPT-5.2时,问题依然存在。个别字母对应的动物有所改善,但模型仍只覆盖了24个字母,遗漏了“U”和“Z”,并在“T”之后直接跳到了“Y”,对应“Yak”。生成的字母表最终以“X”结束,对应“X-ray fish”,但插图却是一只斑马。

GPT-5.2 生成字母挂图错误频出,“人类专家水平”遭质疑

插图本身也存在明显异常,例如肢体结构怪异的袋鼠、长着两条尾巴的鼩鼱、五官混乱的独角鲸,以及带有猫脸特征的刺猬。

在后续提示中,情况并未改善。这一次模型生成了25个字母,“Y”再次取代了“U”,并被解释为“Unicorn”。结尾处出现两个“X”,一个对应“fish”,另一个对应“X-ray fish”,却仍旧使用了一张斑马插图。

此外,模型甚至开始将提示语本身混入生成内容,“A is for alligator, B is for bear…”这段文字直接出现在了海报标题中。

GPT-5.2 生成字母挂图错误频出,“人类专家水平”遭质疑

来源:https://www.ithome.com/0/906/575.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

中国厂商如何应对ChatGPT API开放带来的机遇与挑战
AI
中国厂商如何应对ChatGPT API开放带来的机遇与挑战

三月的第一天,AI圈又被一枚重磅消息炸开了锅。 价格一折 OpenAI在官网正式宣布,向开发者开放ChatGPT的API接口,而且直接拿出了已经集成在ChatGPT产品中的“gpt-3 5-turbo”模型。这相当于把自家的王牌技术直接摆上了货架。 更令人咋舌的是定价:每1000个token仅收费0

热心网友
05.15
Andrej Karpathy重返OpenAI:ChatGPT如何重塑AI科学家价值
AI
Andrej Karpathy重返OpenAI:ChatGPT如何重塑AI科学家价值

人工智能领域传来一则重磅人事变动:知名科学家、李飞飞的高徒、特斯拉前AI总监安德烈·卡帕西(Andrej Karpathy)宣布回归OpenAI。 在其个人推特上,卡帕西毫不掩饰对老东家近期成就的赞赏。他写道,OpenAI在人工智能领域的前沿工作“影响深远,令人深受鼓舞”,他个人也从中获益良多。对于

热心网友
05.15
OpenAI Whisper语音系统发布 英文识别准确率接近人类
AI
OpenAI Whisper语音系统发布 英文识别准确率接近人类

2022年9月21日,OpenAI正式发布了名为“Whisper”的全新神经网络模型。该模型在英语语音识别任务中展现出接近人类水平的准确性与鲁棒性,标志着语音AI技术迈入新阶段。 Whisper本质上是一个先进的自动语音识别(ASR)系统。其核心创新在于训练数据的规模与多样性:研究团队从公开网络资源

热心网友
05.15
OpenAI高管指责苹果合作缺乏诚意拟启动法律程序
业界动态
OpenAI高管指责苹果合作缺乏诚意拟启动法律程序

5月15日,彭博社的一则爆料,给硅谷的科技圈投下了一颗不大不小的石子。据知情人士透露,苹果与OpenAI那场曾被视为“天作之合”的战略联姻,在持续两年后正面临破裂危机。核心矛盾点在于,OpenAI方面认为商业回报远未达预期,甚至已开始考虑采取法律手段。 由于相关讨论尚未公开,消息人士要求匿名。他们指

热心网友
05.15
OpenAI推出企业AI咨询业务助力快速部署
AI
OpenAI推出企业AI咨询业务助力快速部署

OpenAI成立独立咨询公司DeployCo,并获40亿美元投资。新公司将通过派驻前线工程师和收购等方式,帮助企业部署AI应用。此举标志着其战略重心从研发转向大规模企业赋能,旨在弥合AI能力与企业实际应用之间的差距。面对万亿美元规模的系统集成市场,OpenAI将与现有咨询机构形成竞合关系。

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

阿里钉钉文档全功能解析在线协同办公套件使用指南
AI
阿里钉钉文档全功能解析在线协同办公套件使用指南

钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流

热心网友
05.15
商汤小浣熊智能助手基于自研大语言模型
AI
商汤小浣熊智能助手基于自研大语言模型

在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办

热心网友
05.15
MiniMax新一代智能模型矩阵全面解析与应用指南
AI
MiniMax新一代智能模型矩阵全面解析与应用指南

在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M

热心网友
05.15
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景
web3.0
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景

ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。

热心网友
05.15
智能客服机器人解决方案:AI客服系统提升企业服务效率
AI
智能客服机器人解决方案:AI客服系统提升企业服务效率

在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练

热心网友
05.15