教皇通谕被 AI 检测器标记：现在能怀疑什么，不能断定什么

核心摘要 Summary

The Verge 报道称，教皇良十四世关于 AI 的通谕《Magnifica Humanitas》部分段落被 Pangram 标记为可能由 AI 生成。
现有结果只能说明文本存在异常信号，不能证明教皇或梵蒂冈使用了 AI。
更值得警惕的是，AI 检测器正在进入公共文本的信任审判，但它本身也需要被审查。

The Verge 5 月 27 日报道了一件很微妙的事：教皇良十四世讨论 AI 影响人类的通谕《Magnifica Humanitas》，有部分段落被 AI 文本检测工具 Pangram 标记为可能由 AI 生成。

这件事的反常点在这里：一份谈 AI 风险、人类尊严、劳动和战争的宗教公共文本，自己先被检测器盯上了。

但现在不能把它写成“教皇用了 AI”。目前没有证据显示教皇本人或梵蒂冈写作团队使用了 AI。能看到的，只是检测工具和文本分析给出的可疑信号。

我更在意的是另一个问题：当检测器开始判断公共文本的真假，它到底是在帮我们识别风险，还是在制造新的误伤？

AI 检测器到底发现了什么

这轮讨论最早来自 Linch Zhang 在 LessWrong 发布的分析。他称，《Magnifica Humanitas》中若干段落经 Pangram 检测，被判为 40% 到 100% 的 AI 写作概率。

另有人把文件按章节分段检测，称第一章有 62% 内容被标记为 AI 生成。The Verge 也做了复测：把约 2000 词放进 Pangram，结果显示 46% AI 写作。

还有一个被提到的语言线索，是文中 “genuinely” 使用频率偏高。Zhang 认为，这个词更常出现在 Anthropic 的 Claude 输出风格里。

这只能说明文风有相似处。它不能倒推出具体工具，也不能变成“用了 Claude”的证据。

检测对象	来源/工具	结果	更稳妥的读法
部分段落	Linch Zhang / Pangram	40%-100% AI 写作	有异常信号
第一章分段	LessWrong 用户 / Pangram	62% 被标记	异常集中在部分内容
约 2000 词样本	The Verge / Pangram	46% AI 写作	媒体复测方向相近
部分章节、前四封通谕前 20 段、教皇演讲稿	Pangram	100% 人类写作	结果并非全篇一致

最后一行很关键。

如果整篇都被标成 AI，判断会简单一些。现在的情况更复杂：有些段落像机器，有些段落又被判为纯人类。

这不像一张定罪书，更像一组需要解释的文本信号。

为什么不能直接定性为 AI 代写

Pangram 曾在 2025 年 3 月称，它把人类作品误判为 AI 生成的误报率约为万分之一。这个数字听起来很强。

问题是，真实公共文本往往不是单人、一遍、原样写成。

教皇通谕不是私人博客。它通常会经过神学、外交、翻译、编辑等多重打磨。它追求庄重、稳定、可引用，不追求强烈的个人口语。

这种文体，本来就可能接近大模型常见的“平滑正式文”。词频更均匀，句式更规整，情绪更克制。检测器看到这些特征，可能会提高怀疑值。

这不是替任何一方开脱，而是要把证据放回它能承受的位置。

AI 检测器擅长发现统计异常，但它很难还原写作过程。多人协作、翻译润色、模板化公文、语法工具修改，都可能改变文本特征。

教育场景已经吃过这个亏。Turnitin、GPTZero 等工具被用于筛查学生作业后，一直有争议。非英语母语写作者、格式规整的学术文本、经过语法软件润色的文章，都可能更容易被打上 AI 标签。

所以，这次最稳妥的说法是：Pangram 给出了可疑判断，但还不足以证明来源。

如果媒体、学校或机构把“工具标记”直接写成“事实发生”，就会多出一层风险：不是查清问题，而是把算法的猜测包装成结论。

真正被考验的是公共文本的信任流程

这件事最直接影响的，不是普通读者每天要不要用 AI，而是两类人。

一类是新闻编辑和事实核查人员。以后遇到类似文本，不能只写“AI 检测器判定为 AI”。更准确的写法应该区分三件事：工具怎么判、样本怎么取、有没有独立证据。

另一类是宗教机构、大学、政策部门这类发布高关注度文本的团队。他们可能要多做几件很具体的事：保存版本记录，保留审稿链路，说明翻译和编辑流程，必要时解释是否使用过自动化工具。

这会增加成本。

过去，署名和机构背书大体能支撑信任。现在不够了。文本一旦被检测器标红，发布方可能需要拿出过程证据，证明自己不是机器代笔。

但反过来也要看到现实约束。不是每个组织都愿意公开内部写作流程，宗教文本和外交文本尤其如此。要求完全透明，未必现实。

所以接下来更该看三件事：

不同 AI 检测工具是否给出相近结果；
是否出现可核验的写作、翻译或编辑流程信息；
Pangram 是否能说明，它在宗教文体、翻译文本和多人编辑文本上的误判边界。

没有这些变量，结论就只能停在“文本可疑”。不能再往前推。

这桩风波有一点讽刺感：一份提醒人们警惕 AI 的文本，自己被 AI 检测器怀疑了。

但它真正暴露的不是某一篇通谕的秘密，而是一个更日常的麻烦：人写得太像机器，机器写得太像人，公共信任开始需要额外凭证。

这才是更难处理的部分。

教皇通谕被 AI 检测器标记：现在能怀疑什么，不能断定什么

检测风波

异常信号

结果不一

证据边界

概率非事实

误判风险

协作写作

信任流程

媒体核查

AI 检测器到底发现了什么

为什么不能直接定性为 AI 代写

真正被考验的是公共文本的信任流程