DeepMind联手五大AI神殿:陶哲轩警示AI世纪难题挑战
谷歌DeepMind再次重磅出击,联合全球五大顶尖科研机构,集结人工智能的力量直指数学界的桂冠!与此同时,陶哲轩冷静地发出警示:AI的滥用可能带来的潜在风险同样需要警惕。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
今天,谷歌DeepMind正式启动了“AI赋能的数学研究计划”,汇集了全球五大顶尖学术机构的力量。
他们将运用谷歌最先进的数学专用AI系统,探索数学未知疆域中的新发现。

参与这次计划的AI系统阵容强大,包括曾获国际数学奥林匹克金牌的Gemini Deep Think,能够自主发现新算法的AlphaEvolve,以及擅长形式化证明的自动补全工具AlphaProof。
目前,首批合作的学术机构堪称豪华阵容:
伦敦帝国理工学院普林斯顿高等研究院(IAS)法国高等科学研究所(IHES)西蒙斯计算理论研究所(加州大学伯克利分校)塔塔基础科学研究所(TIFR)这五大机构拥有一个共同的使命——发掘那些有望通过AI技术获得突破性进展的数学难题,从而推动科学发现的进程。
然而,令陶哲轩担忧的是,“随着AI在数学研究中的应用日益加深,除了负责任的使用外,AI滥用的案例也屡见不鲜”。
他认为现在正是启动相关讨论的最佳时机,探讨如何将AI最佳地融入数学研究,透明公开其作用方式,并建立风险缓释机制。

这不仅能够守护数学研究的严谨性,更将为AI与数学的深度融合铺设坚实的道路。
五大顶尖机构,联手攻坚数学难题
数学,是描述宇宙运行规律最基础的语言。
在谷歌DeepMind看来,AI可以作为强大的辅助工具,与数学家展开深度合作,激发研究人员的创造力。
“AI赋能数学计划”的诞生,旨在实现三个核心目标:
发掘有望借助AI获得深刻见解的新一代数学难题;
构建支持这些前沿探索所需的基础设施与工具;
最终推动科学发现的加速前进。
这项计划将获得Google.org的专项资金支持,以及谷歌DeepMind顶尖技术的全面赋能。
近几个月来,谷歌DeepMind在自身研究领域取得了显著突破。
2024年,其开发的AlphaGeometry和AlphaProof系统在国际数学奥林匹克竞赛中斩获银牌。

而搭载Deep Think模块的最新Gemini模型,更在今年IMO中展现出金牌水准的卓越表现——完美破解全部六道题目,取得了42分的满分成绩。

今年5月,谷歌DeepMind发布的AlphaEvolve系统,被业界誉为当前最强大的通用人工智能体。

在数学分析、几何学、组合数学和数论领域的50个公开难题中,AlphaEvolve在其中20%的题目上获得了最优解。
更令人瞩目的是,在数学与算法发现领域,它发明了一种全新的、效率更高的矩阵乘法运算方法。

具体而言,在4x4矩阵乘法这一特定问题上,它发现了仅需48次标量乘法的新算法。
这一突破性成果,打破了1969年由Strassen算法保持的长达半个多世纪的历史记录。
不仅如此,在计算机科学领域,AlphaEvolve还协助研究人员发现了一些全新的数学结构。
同时,它也证明了某些复杂问题的求解难度实际上比人们过去想象的要更高,这促使研究者对计算边界有了更清晰、更精准的认知,为未来探索指明了方向。

以上这些重要进展,都是当前AI模型快速发展的有力证明。
对于AI的全部潜力如何推动最深奥的科学问题研究,人类的理解才刚刚开始。
AI与数学融合,边界在何处?
一直以来,陶哲轩既是“AI+数学”领域应用的坚定支持者,也是最佳实践的探索者。
他曾多次联合GPT-5 Pro等顶尖AI系统,破解了许多数学领域的难题,显著提升了研究效率。

毋庸置疑,在数学研究领域,大型语言模型和证明助手等AI工具,正悄然改变着传统的研究范式。
最近,一些顶尖学术论文开始融合AI技术,推动着从形式化证明到复杂计算的全方位创新。

论文地址:https://borisalexeev.com/pdf/erdos707.pdf
然而,随着AI的深度介入,也引出了一个关键问题:
如何确保这些工具的使用,不会损害论文的严谨性和学术价值?
基于这一契机,陶哲轩在公开平台上发起了深入讨论,在长篇贴文中,他提出了三大核心建议。

在以下讨论中,“AI”一词不仅涵盖大语言模型,还包含神经网络、可满足性求解器、证明助手以及其他任何复杂的辅助工具。
1 AI使用声明
论文中,所有对AI实质性功能的使用,包括自动补全、拼写检查,或是用于生成摘要的搜索引擎AI,都必须明确声明。
2 AI风险讨论与缓解措施
论文中,应讨论所用AI工具可能带来的一般性风险,并说明为缓解这些风险已采取的具体措施。
以下将举例说明:
2.1. 内容虚构,出现“幻觉”
AI可能会编造参考文献、证明过程或相关文本,导致事实性错误。
建议不要在论文正文中,直接使用AI生成的文本内容;若必须使用AI输出,则用不同字体或明显标记清晰标注。
2.2. 缺乏可复现性
专有AI或高计算成本的结果难以复现。解决方案是开源提示词、工作流程、验证数据等,让他人都能低成本验证。
2.3. 缺乏可解释性
AI输出往往晦涩难懂,其解释可能站不住脚。建议为每个AI输出配以人类撰写、可读性强的对应内容。
比如,一个定理可以同时包含一个由人类撰写、易于阅读的非形式化证明,以及一个由AI生成但不易阅读的形式化证明。
2.4. 缺乏可验证性
AI容易隐藏细微错误,检查耗时。形式化验证、一致性检查都有助于缓解这一问题,并采用多层次验证方法。
关键是在定理旁加“校验标记”,对未验证部分则明确说明。
2.5. 目标形式化不当
AI可能精确解决“错位”目标,即形式化后偏离作者意图的命题。为此,应从独立来源获取形式化目标,或由人类深度审视形式化过程。
2.6. 可能利用漏洞达成目标
与上一个问题相关联,AI可能会钻形式化表述的空子,例如添加任意公认“证明”的命题。
应对方法是列出已知漏洞,并讨论确保过程严谨的排除机制。
2.7. AI生成代码存在Bug
AI生成代码的bug更加隐蔽,难以用传统标准方法来检测修复。
为此,建议采用大量单元测试、外部验证,或将AI使用限于简单场景,复杂任务由人类修改适配。
3 责任归属
最终,论文的所有作者必须对AI贡献的内容承担责任,包括任何不准确、疏漏或虚假陈述。
除非明确标记为“未经核实”,否则作者不能推卸责任。

以上这些,只是陶哲轩抛砖引玉的初步思考,他希望能够促进更多业界研究人员的深入讨论,进一步完善这份清单。
评论下方,一位研究者John Dvorak直指痛点——
除非我们能跨越临界点,让所有数学证明都用Lean做形式化验证成为学界标准,否则这个问题基本无解。

对此,陶哲轩分享了一个最近观察到的观点,即使用AI审阅稿件质量是可以接受的,但它并非是最主要的筛选工具之一。
说白了,AI评估器终究只是辅助工具,而不能完全取代人类评估者。

相关攻略
OpenAI在激进扩张路线与财务审慎之间的内部张力正浮出水面。据The Information报道,首席执行官Sam Altman私下表示希望最早于今年第四季度完成IPO,而首席财务官Sarah F
4月3日消息,美国时间周四,微软旗下研究部门Microsoft AI宣布推出三款基础人工智能模型,全面覆盖文本、语音及图像生成领域。此举表明,微软在维持与OpenAI深度合作的同时,正持续构建自主的
北京时间4月7日,美国大模型头部公司Anthropic对外公布,公司年化收入(ARR)超过300亿美元,较2025年底的90亿美元大幅增长,Claude需求持续加速,已超过行业披露的OpenAI年化
快科技4月7日消息,据博通当地时间(4月6日)向美国证券交易委员会(SEC)提交的监管文件披露,该公司已与谷歌达成一项长期协议,将为谷歌生产未来版本的定制人工智能芯片。根据协议内容,博通将为谷歌未来
编辑|杨文又到了八卦时间。最近,著名记者、作家塞巴斯蒂安・马拉比出了本新书,名叫《无限机器:德米斯・哈萨比斯、DeepMind 与超级智能的探索》。书中,他披露了一段扎克伯格与 DeepMind 失
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





