OpenAI夸大GPT-5数学能力遭批，学术圈与杨立坤质疑成果真实性

时间：2025-12-06 20:57

近日，OpenAI研究人员在社交平台X上宣称取得数学研究重大进展，但这一说法迅速引发学界质疑并最终撤回。事件核心围绕GPT-5在埃尔德什问题上的表现展开，暴露出AI研究领域沟通方式与成果验证的深层问

近日，OpenAI研究人员在社交平台X上宣称取得了数学研究重大进展，但这一说法迅速引发学界质疑并最终被撤回。事件核心围绕GPT-5在埃尔德什问题上的表现展开，暴露出AI研究领域沟通方式与成果验证的深层问题。

事件起因于OpenAI管理层成员凯文·韦尔发布的一条推文。他声称GPT-5已“解决了10个此前未解的埃尔德什问题”，并在另外11个问题上取得突破，形容这些问题“困扰学界数十年”。该表述被其他研究人员转发后，迅速引发关于AI能否独立进行原创性数学研究的讨论。然而，相关推文在引发争议后被大量删除。

数学家托马斯·布鲁姆率先指出问题所在。他运营的erdosproblems.com网站列出了部分“开放性问题”，但强调这些标注仅代表他个人未掌握答案，而非学术界公认的未解难题。GPT-5实际上是通过检索找到了布鲁姆未注意到的已有研究成果，而非创造新解法。这一澄清直接否定了OpenAI关于“独立发现”的表述。

学界对OpenAI的批评集中在研究沟通的严谨性上。DeepMind首席执行官德米斯·哈萨比斯公开批评其“过于草率”，Meta AI负责人杨立昆则讽刺这是“被炒作反噬”的典型案例。尽管OpenAI研究人员随后承认错误，但事件已加剧外界对其研究规范性的质疑——在涉及数十亿美元利益的AI领域，顶尖机构为何会发布未经充分验证的声明？

争议背后，GPT-5的实际价值逐渐清晰。数学家陶哲轩指出，AI在数学领域的核心潜力不在于攻克最难的问题，而作为高效研究工具整合分散文献。例如当研究问题涉及跨学科学术语或文献分散时，AI可快速追踪相关论文，为研究者节省时间。他强调，目前AI的突破仍属“零星进展”，主要作用是加速研究流程而非替代人类专家。

陶哲轩进一步提醒，AI生成的结果需经人类专家严格审查。他将AI比喻为“数学研究的工业化工具”，可推动领域整体进步，但人类在验证、分类和安全应用AI成果方面仍不可替代。这一观点得到部分学者认同，他们认为当前AI更适用于辅助性工作，而非直接产生重大科学突破。

事件也反映出AI研究领域的普遍挑战。即便了解GPT-5真实能力的研究者，仍可能使用“找到解决方案”等模糊表述，暴露出成果宣传与实际贡献之间的认知偏差。如何在追求技术突破的同时保持学术严谨性，成为行业需要共同面对的课题。

来源：https://www.itbear.com.cn/html/2025-10/991684.html

上一篇Win11升级被sprotect.sys阻止？5步解除限制升级24H2 下一篇苹果Vision Pro开发者版下周更新，功能与价格成焦点

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

科技数码 · 2026-07-05

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

HMDGlobal推出4款诺基亚功能手机，均配1450mAh可拆卸电池及独立AI按键，支持语音控制，免费180天后付费。部分机型带摄像头，支持microSD卡扩展至32GB，具双SIM卡、3 5mm接口及蓝牙5 0。

科技数码 · 2026-07-05

云南以旧换新补贴扩围新增智能影音与无人机

云南省自2026年7月起扩大消费品以旧换新补贴范围，新增智能门锁、智能影音、无人机、数码相机等数码智能产品及吸油烟机、燃气灶、洗碗机、净水器等家电。按最终售价15%补贴，每类每件最高1500元，商户报名无限制。

科技数码 · 2026-07-05

小米Redmi 7英寸高性能手机传闻即将发布

最近圈内又有新动静了。据博主 @数码闲聊站今天爆料，某家厂商的子系列下一代打算推出两款屏幕尺寸差异明显的机型：一块是 6 59 英寸的中屏 Pro，另一块则是 7 英寸的巨屏性能机。从该博主以往的爆料习惯来看，基本可以锁定是小米 REDMI 品牌的产品线布局。有意思的是，早在今年 2 月，这位博

科技数码 · 2026-07-05

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

深光影像AF35mmF2 2CE全画幅镜头开售，提供E卡口和L卡口，标准版七百三十九元，套装版七百八十九元。全金属机身，重约一百七十五克，高三十六毫米，滤镜口径五十二毫米，光学结构五组七片，九片光圈叶片，最近对焦零点三五米，支持自动对焦。