游乐游手机版
首页/AI热点日报/热点详情

普朗克论文被撤稿量子之父与算法争议

类型:热点整理2026-07-02
要是某天你发现,量子之父马克斯·普朗克的名字竟然出现在学术撤稿名单里,第一反应恐怕是以为自己误入了什么学术恶搞网站。 这可不是什么无名小卒。普朗克是量子理论的奠基人,1918年的诺贝尔物理学奖得主,也是20世纪科学史上最响当当的物理学巨匠之一。 但一篇最新的研究论文指出,普朗克在1940年和1942

要是某天你发现,量子之父马克斯·普朗克的名字竟然出现在学术撤稿名单里,第一反应恐怕是以为自己误入了什么学术恶搞网站。

普朗克被撤稿了?量子之父竟被算法绊了一跤

这可不是什么无名小卒。普朗克是量子理论的奠基人,1918年的诺贝尔物理学奖得主,也是20世纪科学史上最响当当的物理学巨匠之一。

但一篇最新的研究论文指出,普朗克在1940年和1942年发表的两篇历史文章,竟然被施普林格(Springer)的数字出版平台标记为“撤回”(retracted)。

更富戏剧性的是,调查显示,这两篇文章被撤稿并非因为学术造假、研究错误或任何学术不端行为,而是被平台的算法误伤了。

整件事的起因,是学术出版问题追踪网站Retraction Watch整理的一份“诺奖得主撤稿名单”。作为物理学史研究者,论文作者在其中看到普朗克的名字时深感意外——这两篇文章均出自德国著名科学期刊《Die Naturwissenschaften》。当时的普朗克已是享誉全球的物理学家,论文作者也难以相信这些文章是在他生前被主动撤回,或者后来存在足够充分的撤稿理由。

施普林格数字平台上的撤稿解释相当含混。页面标题标注着“撤回文章”(RETRACTED ARTICLE),但PDF文件内的说法却是“本文因文章违规被撤销”;网页上的表述稍微明确些,称文章因“版权违规”(copyright violation)被撤回。换句话说,这很可能是版权管理、数字化归档流程和平台元数据系统共同制造出来的事故——这两篇年代久远的文章在现代学术数据库里,被系统或出版商当作版权纠纷或重复发表问题处理了。

让我们回到20世纪上半叶的科学出版生态。《Die Naturwissenschaften》创刊于1913年,由Julius Springer Verlag出版,定位有点像德语世界的《自然》杂志:它是面向自然科学、医学和技术进展的综合性科学周刊。它既发表原创研究论文,也刊登学术演讲、会议报告,以及围绕科学哲学和文化意义的深度讨论。

普朗克的这两篇文章,本身就不是报告新实验或新理论的研究论文,而是关于科学知识本质的哲学性反思。

1942年那篇《精确科学的意义与界限》尤其典型。它原本是普朗克1941年在柏林Kaiser-Wilhelm-Gesellschaft的一次学术演讲,后来以多种形式流通:1942年作为小册子出版,也同时发表在《Europäische Revue》和《Die Naturwissenschaften》上,1943年又被收入普朗克的演讲论文集中。放在今天的学术出版环境下,这种多渠道传播路径很容易被平台或版权系统识别为“重复发表”。但在当时,从演讲到期刊、从小册子到文集的多渠道流通,本来就是科学思想传播的正常方式。

1940年的《自然科学与真实外部世界》就更为离奇了。论文作者并未发现它在其他地方有重复发表的证据。作者提出的一种可能解释是:同一期刊几个月前,另一位作者Aloys Müller曾发表过一篇同名文章,讨论普朗克的哲学立场;普朗克随后用同样标题写了一篇回应,参与这场思想辩论。在当年的编辑文化里,这显然不是问题,甚至是一种明确的学术对话姿态。但到了后来的数字索引、版权管理和元数据系统里,两个相同标题就可能被自动识别成一组可疑的重复内容。

论文还指出,这两篇被撤的文章在施普林格的数字平台上甚至变成了空白页。通常情况下,即便一篇论文被撤稿,原文内容也会保留,只是加上撤稿说明,以维护科学记录的完整性和可追溯性。但这里的情况是,1940年那篇两页文章、1942年那篇九页文章,在数字平台上都被直接抹掉了。今天想看原文,去原始出版方施普林格是看不到的,只能去非营利的互联网档案馆(Internet Archive)寻找。

事情发展到这里,已经不只是“普朗克被误撤稿”的荒诞笑料了,而是现代学术出版基础设施的一次直接翻车:当历史文献进入现代数字出版平台,谁有权决定什么算“重复发表”、什么算“版权违规”、什么又该继续被学术界看见?

论文作者认为,“重复发表”“自我剽窃”这类概念并不是永恒不变的学术伦理标准,而是和20世纪后期以来的文献计量学、科研评价体系、版权转让协议、商业出版平台绑定在一起的现代范畴。论文明确指出,“自我剽窃”是一个相对晚近的概念,随着1990年代以来以论文数量衡量学术生产力的评价系统而兴起。

这也是今天的学术系统格外熟悉的一点:问题不只是“内容是什么”,而是“内容被系统如何表示和归类”。

一篇历史文章进入数据库后,会被拆成数字对象标识符、标题、作者、版权状态、撤稿标签、PDF文件、引用记录等结构化对象。一旦平台按照当代规则自动或半自动地处理旧文献,就可能把过去正常的出版实践,改写成今天的违规事件。

这种错位在AI时代尤其值得警惕。

今天谈训练数据清洗、文献数据库建设、知识图谱构建和检索增强生成,常常默认数字化知识是稳定、可检索、可调用的事实。但这件事提醒我们:数字档案不是中性的“过去之镜”,而是一套带有商业逻辑、法律假设和平台规则的过滤器。数据会被平台重新命名、重新分类,甚至被空白页替代。

一个现代版权和计量系统,把前数字时代正常的科学传播行为,反向判定为可疑操作。更严重的是,这种判定并没有停留在标签层面,而是直接影响了历史文献的可访问性和学术完整性。

对正在进入AI时代的知识生产系统来说,一个错误标签、一段缺失的PDF文档、一次不透明的版权处理,都可能在模型训练、搜索引擎抓取和学术工具中被继续放大。未来的AI助手未必知道普朗克的文章是“误撤”的,它可能只会看到数据库里那个冷冰冰的retracted标记。

当科学记忆越来越多地被数据库、出版商、平台规则和商业基础设施托管,我们还能不能准确地回溯和看见科学的过去?

来源:https://www.jiqizhixin.com/api/article_library/articles/2026-06-30-10

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。