首页 游戏 软件 资讯 排行榜 专题
首页
AI
揭秘顶会泡沫:华裔00后戳破NeurIPS造假,LeCun沉默,53篇论文存疑

揭秘顶会泡沫:华裔00后戳破NeurIPS造假,LeCun沉默,53篇论文存疑

热心网友
26
转载
2026-01-24


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:元宇

【新智元导读】用AI检测AI幻觉,用魔法打败魔法!刚刚,NeurIPS已收录论文被曝出数百条AI幻觉引用,至少53篇论文中招。为了对抗AI幻觉、造假所带来的学术「污染」,首先拿起AI武器的,也应当是AI顶会。

数百项虚假引用,53篇顶会论文被抓包!

刚刚,NeurIPS顶会暴雷,全球AI圈的「奥斯卡」盛会,被一家华人00后的AI初创公司「打假」了。

这家名为GPTZero的公司在扫描了NeurIPS 2025年所接收的4841篇论文后,发现了数百条由AI「编造」出来的引用,至少53篇论文「证据确凿」。

GPTZero CEO Edward Tian将其称作一个重要的节点时刻:

这是首次有记录显示,幻觉引用进入了顶级机器学习会议的最新文献。


GPTZero联合创始人兼CEO Edward Tian(左)与联合创始人兼CTO Alex Cui(右)。

当「John Smith」这种占位符名字(类似中国的张三、李四),堂而皇之地出现在顶会参考文献中,这意味着学术研究的基石已经被AI幻觉「侵蚀」了。

更离谱的是,在GPTZero展示的例子中,图灵奖得主Yann LeCun的名字,以「Samuel LeCun Jackson」的虚构引用形式,出现在了另一篇有关深度学习的论文中。


学术引用的严谨性对于科研的意义不言而喻。

当谎言被引用了一千次,它在数据集中就变成了真理。

如果不加干预,未来的研究者在引用这些「经典」时,就像是在虚无缥缈的云端建造空中楼阁。

以前科学家们的研究是站在了巨人的肩膀上,今后很可能是站在AI的幻觉之上了。

53篇论文惊现AI幻觉引用

顶会滤镜破碎

在AI学术圈,NeurIPS长期以来被视为一座「圣殿」。

在这里发表论文,几乎等同于拿到了进入Google DeepMind或OpenAI等顶级实验室的入场券。

然而,这层看上去高大上的「神圣滤镜」,却被GPTZero击碎了。

他们对NeurIPS 2025已正式发表的4841篇论文进行了一次「地毯式扫描」,结果犹如一记重磅炸弹:

至少53篇论文,被检测出包含数百条由大模型凭空捏造的引用。

最令人震惊的是,这些连链接都可能指向404的低级错误,竟悉数「骗」过了每篇论文至少三名专家的同行评审防线。


NeurIPS 2025现场


顶会的尊严,在AI幻觉面前,显得不堪一击。


https://gptzero.me/news/neurips/

如上图,在GPTZero的最新博客中,公布了53篇NeurIPS论文中发表的100条虚构引用列表。

在上图所显示的这篇论文中,GPTZero检测到存在一篇标题相同的文章,作者显然是伪造的。


在上面这篇关于深度学习技术的论文中,显示无作者或标题匹配,说明该文章不存在于出版物中,其URL和DOI均为伪造。

GPTZero曾尝试通过多种名称来描述AI生成的幻觉引用。

「幻觉引用」(hallucinated citations)太长,「虚假引用」(fake citations)则带有过强的道德评判色彩。


Alex Adams

最终,GPTZero机器学习主管Alex Adams提出了「氛围引用」(vibe citing)一词,用来描述大模型将真实来源进行推导或拼凑,从而生成看似逼真却是虚假信息的倾向。

「氛围引用」与「氛围写作」(vibe writing)或「氛围编码」(vibe coding)类似,其生成的引用乍看之下似乎准确无误,但经不起仔细推敲。


利用AI撰写研究论文迅速流行,体现了「氛围引用」(vibe-citing)的快速增长

从上图中可以看出,2025年4月和9月的峰值分别对应NeurIPS和ICLR 2025的论文提交截止日期。

AI幻觉的进化

Edward Tian认为,NeurIPS的情况更令人担忧,因为问题出现在已经被正式接收并发表的论文中。

根据传统的学术规范,即便只有一条伪造引用,也足以构成拒稿理由。

NeurIPS 2025主赛道论文的接收率为24.52%,这意味着这些存在幻觉引用的论文击败了约15000篇竞争对手。

这些「AI幻觉」造成的引用问题,通过了同行评审,并被收录进最终的会议论文集。

因此,Edward Tian认为这次问题,相比以往是一次明显的升级,也是首次有记录显示幻觉引用进入了顶级机器学习会议的最新文献。

在GPTZero曝光的部分案例中,我们看到了AI幻觉的惊人进化。

最初级错误

最初级错误,是论文参考文献中出现了「John Smith」和「Jane Doe」这样的占位姓名,甚至还有引用链接直接指向404空页面。

而且,这种初级错误竟然逃过了世界顶级专家的法眼。

「半真半假」的隐蔽伪造

这是一种更危险、更深度,也更隐蔽的一种伪造。

AI可能会把多篇真实论文的内容拼接或改写,生成看起来十分可信的标题和作者列表。

它还会把一篇题为「深度学习的优化」的论文,改写成「深度学习中的优化策略」。

乍看上去作者和关键词都对,格式也是BibTeX的标准格式。

审稿人在快速浏览时,大脑会自动补全这些信息,觉得这篇文献很眼熟,于是就通过了。

GPTZero之所以能发现「AI幻觉」,是因为它的结果是基于事实的对照。

据Alex Cui介绍,GPTZero的幻觉检测工具会读取论文全文,通过搜索开放网络和学术数据库,逐条核实引用的作者、标题、发表渠道和链接。

如果一条引用在现实世界找不到对应,或者只与真实论文部分匹配,系统就会拉响警报。

失守的防线

「投稿海啸」与审稿过载困境

如此低级的错误,为什么会绕过层层把关的审稿系统?

答案很现实:由于内卷,学术界的「算力」已经跟不上了。

ICLR、NeurIPS、ICML和AAAI这些全球AI顶会,每年吸引数千篇投稿和大量参与者。

由于AI、论文工厂以及发表压力所引发的「投稿海啸」,已使所有这些会议的审稿流程不堪重负,濒临崩溃。

比如,2020年至2025年间,NeurIPS的投稿量从9467篇激增超过220%,达到21575篇,远高于2024年的15671篇和2024年的12343篇。

即便会议组织者动员了成千上万名志愿评审,但对于每篇论文及其参考文献进行深入审查也变得越来越难。

这就为AI幻觉的出现留下了可乘之机。

对此,NeurIPS理事会的最新回应显然有些苍白:

1.1%的论文因使用大模型而包含一个或多个错误引用,也并不意味着论文内容本身一定无效。例如,作者可能只是向大模型提供了不完整的引用信息,并让模型生成BibTeX(格式化参考文献)。

但是,这种说法在学术态度上也无法站住脚。

如果一位作者连自己的参考文献都懒得核实,直接甩给AI去生成,且不进行复查,我们又怎能相信他在复杂的实验数据上保持了严谨?


就像Hacker News中一位网友说的那样,看到这些被标注错误的论文,会让自己停下来思考:这篇论文的其它部分有多少是借助了AI辅助完成的。


「如果这些是仅有的错误,我们并不担忧,但无法确定这些就已经是全部的错误。这些错误表明该论文在提交时未经过彻底的幻觉检查,作者在使用AI时也缺乏应有的谨慎。」

用魔法打败魔法

NeurIPS「翻车」不止是「氛围引用」那么简单,它动摇的是科研诚信的基石。

科研就像一场接力赛。以AI研究为例,它高度依赖「可复现性」和「溯源」。

就像Edward Tian所说的:「AI研究结果向来难以复现,因此引用至关重要。」

真实准确的引用,能帮助研究者判断某个结果是否可复现,并让他人追溯到具体、可验证的来源进行测试。

因此,如果「氛围引用」的现象不加以遏制,我们将面临一种可怕的「近亲繁殖」效应:

AI生成了包含幻觉的论文,这些论文被收录进数据库,下一代AI模型又拿这些数据进行训练。

最终,AI开始从自己的幻觉中学习知识,导致模型的崩塌。

GPTZero的曝光旨在警示行业漏洞:旧有的「评审体系」,已难以应对投稿量激增和AI使用所带来的问题。

如何捍卫同行评审的尊严?

另一大顶会ICLR(国际表征学习大会)已经觉醒并开始行动。

ICLR将于今年4月举办,吸取了NeurIPS的教训后,它迅速联手GPTZero,已启动了严格的「排雷」行动。

此前,在GPTZero针对ICLR的一项投稿调研中,已经发现了50条成功躲过评审的虚假引用。

去年11月,ICLR还发布了关于大模型生成论文及评审的应对策略。


https://blog.iclr.cc/2025/11/19/iclr-2026-response-to-llm-generated-papers-and-reviews/

ICLR发出的信号非常明确:不封杀AI,但必须透明。

幻觉引用被定性为违反「道德准则」(Code of Ethics),一旦发现大量使用AI未披露或存在虚假内容,将直接拒稿/桌拒(Desk Reject)。

更狠的是,审稿人乱用AI,自己的投稿也将面临被拒的连带惩罚。

此外,ICLR还提到为了避免误判,会结合工具筛选和人工复核,试图通过「人机共治」,筑起抵御虚假内容的新防线。

在AI时代,同行评审机制正被迫进行一场自我进化。

用AI检测AI幻觉,用魔法打败魔法。

为了应对AI幻觉或造假带来的学术「污染」,首先拿起AI武器的,也应当是这些AI顶会。

GPTZero背后的两位年轻创始人

GPTZero之所以能在AI检测领域迅速崭露头角,离不开它两位年轻创始人的完美互补。

Edward Tian


Edward Tian

Edward Tian是GPTZero的CEO ,也是一位拥有华人背景的00后创业者。

就读普林斯顿大学期间,他主修计算机科学,并辅修新闻方向;在创立GPTZero之前,他曾在Microsoft AI从事过研究工作,也做过BBC调查报道相关实践。

这些经历让他更早意识到:当生成式AI大规模普及后,「内容真实性」与「学术诚信」将面临新的挑战。

2024年底ChatGPT上线引爆关注之后,Edward Tian在寒假期间快速做出了GPTZero的产品原型,并将困惑度(perplexity)与突发性(burstiness)等统计特征作为检测的重要指标。


他认为人类写作在这两项指标上通常表现出更强的随机性和结构波动,据此能够推测出一段文字是人工撰写还是AI生成的。

AlexCui


Alex Cui

Alex Cui是GPTZero的联合创始人兼CTO。

他在多伦多大学完成计算机科学硕士学位。在加入GPTZero之前,曾在自动驾驶公司Waabi担任研究科学家。

作为GPTZero的CTO,Alex负责推进包括为微软和谷歌产品开发的插件,帮助用户在任何文档或 上检测AI生成的文本。

二人并非临时组队,而是高中时期的好友。GPTZero早期团队组建时,Edward便邀请Alex加入并负责技术推进。

参考资料:

https://fortune.com/2026/01/21/neurips-ai-conferences-research-papers-hallucinations/


来源:https://www.163.com/dy/article/KK1R280U0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

中国首个医生版“龙虾”来了!百度造
AI
中国首个医生版“龙虾”来了!百度造

智东西作者 杨京丽编辑 心缘智东西4月2日报道,今天,百度健康发布了国内首个医生版“龙虾”——有医助理,这是国内首款基于Claw框架打造的医生任务型AI助手。区别于市面上多数停留在医疗百科或

热心网友
04.07
中科院期刊分区表停更,不再作为学术评价依据
科技数码
中科院期刊分区表停更,不再作为学术评价依据

IT之家 3 月 30 日消息,中国科学院文献情报中心在 3 月 27 日发表声明,宣布将不再更新与发布期刊分区表。这标志着运行二十余年、一度成为科研评价“硬标尺”的中国科学院期刊分区表,正式退出历

热心网友
03.30
上海数月造出极耐碱蛋白:从卷模型到拼数据,语料普惠计划升级2.0
科技数码
上海数月造出极耐碱蛋白:从卷模型到拼数据,语料普惠计划升级2.0

上海一家蛋白质研发平台公司,采集了马里亚纳海沟、盐湖等极端环境下依然存活的微生物,并标注温度、压强、PH值等多维指标,形成尤为珍贵的蛋白质数据集,随后借由AI大模型能力,仅数月就改造出一种耐碱性提升

热心网友
03.30
复旦MOSS团队发布多智体系,实现文献调研到论文撰写全流程
科技数码
复旦MOSS团队发布多智体系,实现文献调研到论文撰写全流程

科研活动具有高门槛和高试错成本特点,在现有学术体系中,大量“失败”结果往往未被公开记录,无法被不同研究者反复探索。基于大语言模型的自动化研究系统则有望缓解这一难题。由复旦大学MOSS团队核心成员创办

热心网友
02.13
引文幻觉下降的AI新模型,准确率逼近人类专家
科技数码
引文幻觉下降的AI新模型,准确率逼近人类专家

来源:科技日报科技日报记者 张梦然《自然》4日报道了一个开源语言模型“OpenScholar”,其在准确进行文献综述方面可超越商用大语言模型。比如,在该研究开展的实验中,GPT4o会在78%至90%

热心网友
02.05

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

追觅宣布进军天文领域 构建“空天地一体化”生态
科技数码
追觅宣布进军天文领域 构建“空天地一体化”生态

“我们的代码,终将写入繁星”:追觅科技成立天文BU,构建从地面到太空的生态闭环 “我们的代码,终将写入繁星。”这句来自追觅科技的宣言,不只是一句诗意的口号,更是一份清晰的战略升级路线图。就在9月10日,这家中国科技企业正式宣告成立天文业务单元(BU),由此完成了一次至关重要的战略跃迁。这标志着其“全

热心网友
04.17
Just Learn
AI
Just Learn

Just Learn是什么 提起用AI为教育赋能,Just Learn这款工具是个绕不开的名字。它由Just Learn公司开发,核心目标非常明确:一手帮教师扩展专业能力,一手为学生打造个性化的学习旅程。说到底,它的价值在于通过AI驱动学习和24 7全天候辅导这两大核心,把教育资源重新“盘活”,让老

热心网友
04.17
Vue 渲染机制中的伪代码拆解:三分钟看懂 Patch 函数的核心逻辑
前端开发
Vue 渲染机制中的伪代码拆解:三分钟看懂 Patch 函数的核心逻辑

Vue 渲染机制深度解析:Patch 函数核心逻辑与优化策略 Vue js 的响应式系统实现了数据驱动视图的核心理念。然而,当数据发生变化时,视图是如何被高效且准确地更新的呢?这背后的核心引擎,正是虚拟 DOM 体系中的 Patch 函数。它并非直接操作真实 DOM,而是通过深度比对新旧虚拟节点(V

热心网友
04.17
JRPG神作《空之轨迹 the 2nd》发售日公布!首批特典送前作
游戏评测
JRPG神作《空之轨迹 the 2nd》发售日公布!首批特典送前作

《空之轨迹SC》完全重制版《空之轨迹 the 2nd》正式定档2026年9月17日,登陆多平台 日本Falcom官方正式公布,经典日式角色扮演游戏《空之轨迹SC》的完全重制版——《空之轨迹 the 2nd》,将于2026年9月17日全球同步发售。本作将登陆任天堂Switch 2、Switch、Pla

热心网友
04.17
AI Art Prompt Generator
AI
AI Art Prompt Generator

AI艺术提示生成器是什么 简单来说,你可以把它理解为一个永不枯竭的创意火花塞。这个基于前沿AI技术的工具,专为破解创作瓶颈而生,无论你是专业画师还是灵感偶尔“罢工”的爱好者,它都能派上用场。它的工作原理并不复杂:依托当前顶级的OpenAI模型,将你的初步想法“催化”成一系列具体、新颖且富有启发性的艺

热心网友
04.17