公元 79 年,维苏威火山把赫库兰尼姆的纸草卷烧成了黑色硬块。它们保存下来了,但也几乎失去了可读性:一碰就碎,硬拆就是毁文物。
现在,Vesuvius Challenge 团队说,他们第一次在不物理展开实物的情况下,完整虚拟展开并读出了其中一卷:PHerc. 1667。不是几个零散词,而是幸存内芯从头到尾的连续文本。更难得的是,数据和代码也一起公开了。
这次到底读出了什么
| 对象 | 这次给出的信息 | 还要保留的限制 |
|---|---|---|
| PHerc. 1667 | 约 1.4 米、约 22 栏希腊文被连续读出 | 读到的是幸存内芯,不是完整原始卷轴 |
| 内容判断 | 倾向于伦理学哲学论著,偏斯多葛传统 | 目前仍是预印本结果,需继续校勘 |
| 末栏线索 | 提到 Aristocreon,与 Chrysippus 传统相关 | 文本仍有破损和缺口 |
| 方法链条 | 相位衬度 X 射线微断层扫描、几何重建、虚拟展平、机器学习识墨、纸草学家复核 | 不是 AI 独立破解古希腊文 |
PHerc. 1667 也不是完好无损的“时间胶囊”。19 世纪、1969 年和 1980 年代的物理展开尝试,已经破坏了外层。今天读出的,是剩下的连续部分。
另外两卷提供了关键验证。PHerc. Paris 4 的更高分辨率数据,让墨迹在 3D X 射线数据里直接可见,并与 2023 年获奖读数一一对应。PHerc. 139 则读出了题名和作者归属:Philodemus 的《论诸神》第八卷。它说明,这套方法不只是在“看见”卷轴,还能先判断封闭卷轴里到底是什么。
真正的分水岭,不是认字,是把流程做出来
我更在意的,不是“AI 又立功了”,而是这件事终于从展示样品变成了方法。
赫库兰尼姆纸草卷最麻烦的地方,在于墨和碳化纸草太像。肉眼看不见,普通扫描也不够。团队用的是 ESRF 的高分辨率相位衬度 X 射线微断层扫描,先找出卷轴内部一层层纸草的几何结构,再虚拟展平,最后用机器学习去增强墨迹信号。
这条链路里,没有谁能单独把事做完。
- 成像给物理证据
- 几何重建给页面
- 机器学习给可疑墨迹
- 纸草学家给转写和判断
“工欲善其事,必先利其器。”这句话放在这里很合适。不是工具替代了学者,而是工具把学者带到了此前到不了的现场。
所以我不太买账“AI 读古卷”这种说法。它把最难的组织协作压扁了。真正值钱的,不是某个模型突然通灵,而是一套方法能被别人检查、复算、改进,再拿去读下一卷。
谁会受影响,接下来该看什么
对关注 AI 和科学发现的人,这件事更像一个公开基准,而不是一则神话。
| 读者 / 使用者 | 直接影响 | 更现实的动作 |
|---|---|---|
| AI / 机器学习团队 | 看到一个真实、复杂、可复核的识别任务 | 关注公开数据集、错误模式和可复现性,不要只看演示视频 |
| 科学成像 / 数字人文团队 | 看到成像、重建、识别、校勘可以接成一条链 | 评估这套流程能否迁移到别的卷轴或类似脆弱文物 |
| 古典学与纸草学研究者 | 获得更多文本和题名线索 | 继续校勘、比对、修正读法,而不是把预印本当终局 |
| 开放科学支持者 | 看到公开数据和代码的硬价值 | 盯住数据是否持续开放、代码是否还能复现、模型是否能被他人接上 |
对做工具的人来说,最该盯的是三件事:
- 能不能读更多卷
- 能不能在更差的卷轴上也读出来
- 成本能不能降到可持续
如果这三项都过不了,今天的结果就只是一次漂亮演示。它会留在新闻里,不会留在方法里。
对古典学、数字人文和开放科学读者,这次的意义更直接。过去,很多卷轴是“保存着,但不能读”。现在,它们开始变成可逐卷处理的文本对象。门槛还在,专家也还在,争议也不会少,但知识不再只靠运气从裂缝里漏出来。
这很像很多技术史里的老剧情。新工具刚出现时,总有人把它吹成终点。真正改变局面的,往往是它能不能被别人拿去用、拿去验、拿去继续做下去。今天这件事,离“终点”还远,离“可复制”近了很多。
两千年前的火山把书封进黑暗里。今天把它们带出来的,不是神迹,是一条终于接通的工作流。器成,事才算开始。
