人工智能再度立功,助力考古新突破!
被火山灰掩埋两千年的古老智慧,如今正借助AI技术逐步“复活”。你可能好奇,早已碳化的纸草卷轴,如何在今天被重新“阅读”?答案,潜藏于机器学习与计算机视觉的交叉领域。

2025年5月6日,维苏威挑战赛(Vesuvius Challenge)迎来了真正的历史性时刻——研究团队首次在不打开卷轴的前提下,从编号为PHerc. 172的赫库兰尼姆古卷(Herculaneum scroll)碳化表层中,“看见了”古代文字。

PHerc. 172现藏于牛津大学博德利图书馆(英国第二大图书馆,仅次于大英图书馆)。
这不仅是技术上的胜利,更是人类首次实现非侵入式地读取一个仍处于卷曲状态的卷轴标题。该成果因此荣获本轮挑战的首个「首标题奖」(First Title Prize),奖金高达60,000美元。

回顾2024年2月,AI破译2000年前“上古卷轴”的新闻曾登上Nature头版。当时三位天才拿下70万美元大奖,其中21岁的Luke Farritor成为史上第一位从赫库兰尼姆卷轴中读出完整单词ΠΟΡΦΥΡΑϹ(意为紫色)的人,并赢得首字母奖第一名。


时隔一年,AI与考古的交叉研究取得最新进展。本次被解读的卷轴编号为PHerc. 172,经AI图像分割与墨迹检测技术分析后,识别出的标题是:
Philodemus, On Vices, Book 1
斐洛德谟,《论恶习》,第一卷


试试看,你是否能一眼看出其中的匹配关系?
有意思的是,这一发现由两方独立完成。维苏威挑战研究团队的Sean Johnson制作了分割图和图像,揭示了写在纸莎草表面的文字标题。几乎同一时间,参赛团队Marcel Roth和Micha Nowak也得出相同结论,并改进了墨水检测方法,进一步完善了文本。正是基于这一贡献,Marcel Roth和Micha Nowak赢得了首个「首标题奖」,奖金60,000美元。
这几位获奖者自2023年以来一直参与Vesuvius Challenge,期间已拿下多个进度奖。

Micha本人是一名机器学习工程师,一直热衷于挑战计算机辅助视觉和破解大语言模型(LLM)。

更令人振奋的是,本次读取的文字内容不仅明确了作者是古希腊著名哲学家斐洛德谟(Philodemus),还确认了这部作品属于他的重要著作《论恶习》。此前学界推测该书为多卷本,此次解读出的内容,或将彻底重塑学界对整部作品结构体系的认知。
一个卷轴的重生,古老图书馆苏醒的序曲
维苏威挑战赛始于2023年,是一项融合机器学习、计算机视觉、3D几何建模的科研竞赛。其终极目标是解读那些被火山碳化、封存了两千年的赫库兰尼姆古卷——这些卷轴曾是罗马帝国贵族别墅「纸草别墅」(Villa of the Papyri)的私人藏书。它们在公元79年维苏威火山爆发时被碳化,但也因此意外地保存了下来。

自比赛启动以来,全球参与者已解锁数十段古代文本,累计获得超过150万美元的奖金。为鼓励研究人员挑战“整卷阅读”,本届挑战设置了极具吸引力的奖项阶梯:
- $60,000:首字母奖(First Letters)——识别出任意一卷新卷轴的第一个字母
- $60,000:首标题奖(First Title)——非侵入性识别出卷轴的完整标题
- $200,000:整卷阅读奖(Read Entire Scroll)——首位完整解读整卷的人即可获得
没错,如果你能解读整卷,就能直接入账20万美元!

本次PHerc. 172的成功,证明AI可以“透视”火山遗迹,分辨出微弱的墨迹,并自动拼合3D折叠结构——这为整卷阅读铺平了道路。
重大发现:不寻常的标题排版
标题在赫库兰尼姆卷轴中并不罕见,但这次发现的标题却有些特殊。在迄今为止所有标题中,这是第一个在同一行里包含了书卷编号的标题。通常,作者的名字、标题和卷号各自居中显示在新的一行上,像下图这样。

当然,有一种可能是《论恶习》的草稿版本,但考虑到标题上下装饰性的破折号,这种可能性较小。
除了排版,卷号本身也引发了更深层次的疑问。根据纸草学团队成员、伦敦大学学院/牛津大学的Michael McOsker的说法,学界通常认为《论恶习》的第一卷是《论谄媚》(这来自物理展开的纸草)。他指出,PHerc. 172的文本似乎与《论谄媚》的文本不符。这意味着,如果这确实是第一卷,历史学家将不得不重新调整对整部作品的理解。此外,标题看起来是完整的,但除了作品名称和卷号外,并没有包含特定的卷名。
《论恶习》之所以备受关注,不仅因为其哲学内容,还因为在其某一卷中,斐洛德谟提到了他的几位朋友:Quintilius Varus、Varius Rufus、Plotius Tucca——甚至还有Vergil!
AI,让历史重生
时间回到公元79年,维苏威火山爆发。在赫库兰尼姆,二十米厚的热泥和灰烬埋葬了一座曾属于尤利乌斯·凯撒的巨大别墅。别墅里面,是一个庞大的纸莎草卷轴图书馆。

几个世纪以来,几乎所有暴露在空气中的古代文献都腐烂消失了,但纸草别墅的图书馆却完好无损地深埋地下。直到1750年,一位意大利农民在挖掘一口井时,发现了一块大理石铺路石。挖掘工作出土了美丽的雕像和壁画——还有数百卷手稿。这些手稿碳化且灰白,极其脆弱。但打开它们的诱惑巨大;如果能够阅读,这些手稿将极大丰富我们拥有的古代文献数量。

2015年,肯塔基大学的Brent Seales博士团队利用X射线断层扫描和计算机视觉,成功在不打开恩格迪卷轴的情况下读取其内容,发现其中含有《利未记》文本。这一成果证明了碳墨可被识别,为后来的「维苏威挑战赛」奠定了技术基础。

再到今天的2025年,AI的加入加速了这一进程。借助虚拟展开技术,要阅读一卷卷轴,首先需要将其展开——虚拟地展开!

最后通过墨水检测,还原卷轴内容。这个过程中需要用到的技能,包括图像标注、计算机视觉、机器学习、模式识别等。

在今天能够首次读取完整的「首标题」前,第一次看到该卷轴的内容也发生在2025年。

图:PHerc. 172的自动分段输出
2025年2月5日,研究人员成功生成了PHerc. 172号卷轴内部的第一张图像。2025年5月6日,第一次识别到卷轴内的首个标题。照这个节奏,在AI的加持下,研究人员的解读速度只会越来越快。
目前已有多个卷轴数据集开放,等待着下一个“Philodemus”浮出卷面。PHerc. 172的经验也表明:标题文字往往隐藏在卷轴前部的纸张中,仍有大量「首字母与首标题」尚未被发现。
AI不仅能创造未来,也能“阅读”过去。如果你有图像处理、机器学习、几何建模或古典语言背景,不妨加入这场挑战!
