游乐游手机版
首页/科技数码/文章详情

GPT-5意外破解加密难题,哈萨克斯坦抄袭风波引争议

时间:2025-10-21 12:09
GPT-5一场闹剧,让OpenAI出大糗了!让所有人都以为GPT-5破解了十道Erdos难题,没想到竟是查文献给出了答案。Hassabis点评,这太尴尬了。 麻 将 OpenAI团队狂吹了一波G

GPT-5这次闹出的乌龙,让OpenAI颜面扫地!所有人都以为它破解了十道Erdos难题,没想到竟是查阅文献后才给出的答案。Hassabis忍不住评价道:“这简直太尴尬了。”

OpenAI团队此前大肆宣传GPT-5的突破,结果却演变成一场闹剧。

事情要从几天前说起。

OpenAI科学家Sebastien Bubeck激动地转发了一条消息:两位研究员联袂GPT-5 Pro,仅用了一个周末就解决了10个“百年悬案”——

埃尔德什难题(Erdos problems)

紧接着,OpenAI首席运营官Kevin Weil等人也纷纷跟进,开始大规模宣传。

然而真相很快浮出水面:

这十道难题其实早已被学界解决,并非由GPT-5独立破解,它只是通过检索网络文献找到了现成答案。

消息一出舆论哗然。就连谷歌DeepMind CEO Demis Hassabis也直言不讳地评价:“这也太尴尬了。”

更戏剧性的是,图灵奖得主LeCun突然在X上嘲讽:“简直就是搬起石头(GPT)砸自己的脚。”

GPT-5上演的闹剧

这场风波完全可以说是OpenAI团队自导自演的结果。

研究人员Mark Sellke和Mehtaab Sawhney在原文中明确表示,并没有声称GPT-5破解了这些难题。

他们原帖写道,通过GPT-5数千次查询后,找到了十个被列为Erdos问题的解法。

当时的结果显示,问题223、339、494、515、621、822、883、903、1043、1079都得到了解决,同时在另外11个问题上也取得了部分进展。

而另一方面,这十道难题其实早有答案,只是网站管理者没有及时更新状态。

访问地址:https://www.erdosproblems.com/

英国皇家学会研究员Thomas Bloom,作为erdosproblems.com的运营者,却对此并不知情。

他在X上解释,“开放”状态仅代表他个人不了解该问题的解法,而不是表示该问题在科学界尚未被解决。

总而言之,两个误会凑在了一起,让人们产生了“幻觉”——以为GPT-5攻克了埃尔德什难题。

一方面,难题并非未解决,只是维护者不清楚;另一方面,GPT-5仅通过检索文献完成,而非自己解决。

Sebastien Bubeck尴尬地回应道,GPT-5只是在文献中找到了解决方案,仅此而已。

即便如此,这已经非常高效了,因为我知道文献检索本身就有多困难。

业界热议:仍需同行评审

评论区的大佬们,正坐在前排吃瓜。

通过这场争议,开发者Matt Mazur认真地表示,所有人都必须谨慎对待任何关于AI发现新科学/数学成果的说法。

Hyperbolic创始人Yuchen Jin称,“关于AI发现科学/数学的新发现,需要更多的同行评审”。

不过也有人认为,这对GPT-5来说并不尴尬,毕竟它在文献检索方面表现还是相当出色的。

几天前,陶哲轩也曾发文表示,越来越觉得眼下的AI要在数学领域真正发挥作用,关键可能不在于用最牛的模型去攻克最难的题目——

当然偶尔会有这种案例,特别是当人们投入大量算力和专家精力的时候。

但更靠谱的路线,反而是用中等水平的AI工具,去帮我们搞定那些研究里绕不开的琐碎活、体力活。

无论何时,对AI原创发现保持审慎都是第一位的,但这并不妨碍AI辅助科研成为未来的必经之路。

参考资料:

https://x.com/SebastienBubeck/status/1979539604522127746

https://x.com/thomasfbloom/status/1979254235075059732

来源:https://36kr.com/p/3518280598936704
上一篇最终幻想7重生7章叙事优化:玩家热议的叙事节奏改进 下一篇iQOO 15标准版光追实测:手游玩出端游画质,越级对标Pro
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5