AI重塑数学教育:陶哲轩学生闭卷成绩下降引关注
3月12日,OpenAI核心高管Mark Chen与菲尔兹奖得主陶哲轩在加州大学洛杉矶分校纯粹与应用数学研究所展开对话,全面揭示了人工智能在数学与科研领域取得的突破性进展。陶哲轩谈到,过去一年间,AI已从“效率不高的研究助手”蜕变为常态化的生产力工具。根据OpenAI披露的数据,其AI模型目前在高中数学和编程竞赛中已达到金牌水平,该机构的核心目标已从参与竞赛排名转向推动基础科学的前沿探索。

在具体的数学研究应用层面,陶哲轩指出,AI工具目前已能凭借极少量的人工干预,独立解决20至30个尚未被深入探索的埃尔德什问题,并能通过其他AI工具完成交叉验证。人工智能的介入正在为传统上高度依赖个人单打独斗的数学界引入劳动分工机制,研究人员开始将策略生成、繁琐计算等环节外包给大型模型。然而,当前人机协作的核心痛点在于验证瓶颈——AI能够快速生成数百种潜在证明策略,但评估这些策略的创新性与有效性仍极大依赖人类专家的介入。同时,陶哲轩警告称,过度强大的AI系统在运作时可能会为了最大化输出而寻找漏洞,例如在形式化验证系统中暗中添加公理以实现作弊,这要求学术界重新审视验证工具的局限性。
AI的渗透同时也直接冲击了现有的教育评估体系。陶哲轩在教学实践中观察到,学生平时的家庭作业分数出现上升,但线下闭卷考试成绩却呈现下降趋势。基础层学生倾向于利用AI将成绩提升至平均水平,而顶尖学生则因担忧技能退化而谨慎使用。为应对这一现象,传统每周布置作业的考核方式正面临淘汰,教育界将被迫转向基于项目的评估和口头考核。在产品形态的演进上,Mark Chen透露OpenAI今年正致力于开发全新的交互式智能体,试图将AI从单一的问答工具转化为能够进行多轮沟通、共同塑造思路的科研协作伙伴。
除了深耕数学与物理领域,OpenAI的科学探索正在向更广泛的产业界延伸。Mark Chen提到,OpenAI已将AI模型引入生物学领域的湿实验室流程,通过与Ginkgo Bioworks合作优化核心工程,成功将蛋白质合成成本的效率提升了40%。
针对外界关注的AI科研成果署名与数据归属争议,OpenAI方面明确表态,AI本质上是如同显微镜一般的科学基础设施,推动科学进步的底层驱动力与核心荣誉仍应绝对归属于人类科学家群体与整个开源生态系统。
相关攻略
Jay 发自 凹非寺量子位 | 公众号 QbitAI陶哲轩在普林斯顿高等研究院待了一年,差点让他江郎才尽了。在与顶级播客主理人Dwarkesh Patel的最新访谈中,这位菲尔兹奖得主用亲身经历,向
3月12日,近日,OpenAI核心高管Mark Chen与菲尔兹奖得主陶哲轩在加州大学洛杉矶分校纯粹与应用数学研究所展开对话,全面披露了AI在数学与科研领域的突破。陶哲轩表示,过去一年AI已从“低
新智元报道编辑:元宇【新智元导读】从电脑崩溃到半小时拿下Lean形式化证明,数学大神陶哲轩用亲身踩坑经历警告:AI越强大,人类越不能偷懒,应时刻保持「人类在环」的绝对清醒。连跑45分钟,烧光Toke
近日,菲尔兹奖得主、加州大学洛杉矶分校(UCLA)数学系教授陶哲轩(Terence Tao)在 YouTube 发布了一段时长约 26 分钟的实操视频,详细演示了如何利用 Anthropic 推出的
新智元报道编辑:定慧 好困【新智元导读】Google DeepMind最新AI智能体Aletheia在FirstProof挑战赛中,独立攻克了6道世界级数学难题,实现了从竞赛水平到PhD科研级的质变
热门专题
热门推荐
华硕ROG正式发布2026款枪神、魔霸及魔霸新锐系列游戏本并开启预约。枪神系列分为标准版与超竞版,均搭载酷睿Ultra9处理器,超竞版可选RTX5090显卡并配备光显矩阵屏。魔霸系列采用AMD锐龙处理器,高配可选锐龙99955HX3D与RTX5070Ti显卡。魔霸新锐系列主打性价比,配备RTX5060显卡,面向预算有限的玩家。
内存价格高企,单通道DDR5成为高性价比装机方案,但会降低游戏性能。测试显示,锐龙59600X凭借Zen5大核架构及对内存低延迟的优化,在搭配单条DDR56000内存时,游戏性能损失较小。相比之下,酷睿Ultra200SPLUS系列更依赖高带宽,单通道下性能下滑明显。在多款热门电竞网游实测中,锐龙59600X性能领先,且整机性价比优势显著。
神牛发布ML40系列摄影灯,包含ML40Bi和ML40R两款。ML40Bi售价568元,内置锂电池,支持边充边用及NFC快速连接,侧重便携智能。ML40R售价698元,具备更广色温调节范围,侧重专业色彩控制。两者均采用磁吸设计,兼容丰富附件,满足不同布光需求。
华硕TUFGaming系列推出新款850W白金重炮手氮化镓电源,到手价849元。该电源符合ATX3 1规范,长度150mm,采用全模组设计,配备12V-2×6接口支持600W峰值功率。其获得双白金效率认证与A-噪声认证,内部使用氮化镓元件与长寿电容,搭配135mm静音风扇,并提供8年质保,主打高效、安静与持久稳定。
FalconUSD(USDF)是一种与美元挂钩的稳定币,旨在为Web3生态系统提供可靠的交易媒介和价值储存工具。其运作依赖于储备资产支持和透明审计机制,在DeFi、跨境支付等场景有应用潜力。了解其技术原理、市场定位及潜在风险,有助于理性评估这一新兴数字资产的价值与前景。





