西雅图软件工程师 Gregor Stocks 正在用一个个人项目保存《万智牌》的互联网写作史。他建立的 Library of Leng 目前索引约17.5万篇内容,来源包括早期 Usenet 帖文、个人网站文章、Internet Archive 保存的旧网页,以及发行商 Wizards of the Coast 过去发布的部分官方更新。

这件事真正重要的地方,不是又多了一个玩家资料站,而是它把一个更普遍的问题摆到了台前:大量90年代和2000年代早期的互联网内容,并不是因为没人需要而消失,而是因为没人持续为它们付维护成本。

Library of Leng 保存的是索引,不是全文搬运

Library of Leng 的做法相对克制。它不在未经授权的情况下全文转载文章,而是展示标题、摘要片段,并把读者导向 Wayback Machine 或 Internet Archive 上的存档页面。Stocks 曾联系 Wizards of the Coast,希望获得托管旧官方内容的许可,但截至原报道发布时尚未得到回应。

这一区分很关键。很多社区档案项目最容易踩到的线,是把“保存”做成“复制”。Library of Leng 目前更像一个面向《万智牌》写作史的检索层,把散落在旧网页、论坛和官方站点里的线索重新连起来。

项目Library of Leng 的做法现实限制
收录范围约17.5万篇《万智牌》相关内容索引不等于完整覆盖全部历史写作
内容呈现标题、片段、作者、日期、归档链接未授权内容不全文转载
主要来源Usenet、旧网站、Wizards 官方更新、Internet Archive纸媒、扫描件和 OCR 内容仍大量缺失
版权处理可按作者要求移除索引Wizards 授权仍未确认

最难的不是存储,而是让旧网页重新可读

Stocks 提到,项目最棘手的工作是解析早期互联网数据。今天的内容管理系统会统一标题、日期、作者、卡牌名称和套牌列表格式;90年代和2000年代早期的许多网页则是手写 HTML,格式混乱,拼写错误常见,元数据缺失也很正常。

这也是个人档案项目常被低估的成本。保存一个页面截图不难,难的是把它变成可搜索、可比对、可长期维护的数据。对《万智牌》玩家来说,这意味着他们可以重新找到曾影响战术理解的旧文,例如1999年的经典策略文章《Who’s The Beatdown》。对研究游戏社区、玩家文化和早期网络出版的人来说,这类索引则提供了比零散搜索更可靠的入口。

横向看,Internet Archive 承担的是公共互联网记忆的基础设施角色;Library of Leng 这类垂直项目则负责补上语境和结构。前者保存面广,后者知道哪些作者、术语和历史节点值得连在一起。问题在于,后者通常靠个人热情维持,抗风险能力弱。

社区支持不能替代授权,缺口也不会自动补齐

目前社区反馈偏正面:读者找回了曾经只记得片段的文章,也有作者主动要求把自己的作品加入索引。Stocks 表示,暂时还没有作者要求从索引中移除作品,但如果有人提出,他会照做。

真正需要观察的变量有两个。一个是 Wizards of the Coast 是否愿意给旧官方内容更明确的保存许可;另一个是 Library of Leng 能否处理纸媒扫描件和 OCR。原文提到,像 InQuest 这类90年代杂志的扫描件虽已出现在 Internet Archive,但 OCR 比解析 HTML 更麻烦,错误率和人工校对成本都会上升。

所以,这个项目现在最适合被理解为“可搜索的历史入口”,而不是《万智牌》写作史的最终全集。它帮玩家、作者和研究者少走很多弯路,但也提醒人们:互联网档案不是天然存在的公共物品,它常常只是某个具体的人,在下班后写脚本、修字段、处理坏链接的结果。