The Verge 5 月 27 日报道了一件很微妙的事:教皇良十四世讨论 AI 影响人类的通谕《Magnifica Humanitas》,有部分段落被 AI 文本检测工具 Pangram 标记为可能由 AI 生成。
这件事的反常点在这里:一份谈 AI 风险、人类尊严、劳动和战争的宗教公共文本,自己先被检测器盯上了。
但现在不能把它写成“教皇用了 AI”。目前没有证据显示教皇本人或梵蒂冈写作团队使用了 AI。能看到的,只是检测工具和文本分析给出的可疑信号。
我更在意的是另一个问题:当检测器开始判断公共文本的真假,它到底是在帮我们识别风险,还是在制造新的误伤?
AI 检测器到底发现了什么
这轮讨论最早来自 Linch Zhang 在 LessWrong 发布的分析。他称,《Magnifica Humanitas》中若干段落经 Pangram 检测,被判为 40% 到 100% 的 AI 写作概率。
另有人把文件按章节分段检测,称第一章有 62% 内容被标记为 AI 生成。The Verge 也做了复测:把约 2000 词放进 Pangram,结果显示 46% AI 写作。
还有一个被提到的语言线索,是文中 “genuinely” 使用频率偏高。Zhang 认为,这个词更常出现在 Anthropic 的 Claude 输出风格里。
这只能说明文风有相似处。它不能倒推出具体工具,也不能变成“用了 Claude”的证据。
| 检测对象 | 来源/工具 | 结果 | 更稳妥的读法 |
|---|---|---|---|
| 部分段落 | Linch Zhang / Pangram | 40%-100% AI 写作 | 有异常信号 |
| 第一章分段 | LessWrong 用户 / Pangram | 62% 被标记 | 异常集中在部分内容 |
| 约 2000 词样本 | The Verge / Pangram | 46% AI 写作 | 媒体复测方向相近 |
| 部分章节、前四封通谕前 20 段、教皇演讲稿 | Pangram | 100% 人类写作 | 结果并非全篇一致 |
最后一行很关键。
如果整篇都被标成 AI,判断会简单一些。现在的情况更复杂:有些段落像机器,有些段落又被判为纯人类。
这不像一张定罪书,更像一组需要解释的文本信号。
为什么不能直接定性为 AI 代写
Pangram 曾在 2025 年 3 月称,它把人类作品误判为 AI 生成的误报率约为万分之一。这个数字听起来很强。
问题是,真实公共文本往往不是单人、一遍、原样写成。
教皇通谕不是私人博客。它通常会经过神学、外交、翻译、编辑等多重打磨。它追求庄重、稳定、可引用,不追求强烈的个人口语。
这种文体,本来就可能接近大模型常见的“平滑正式文”。词频更均匀,句式更规整,情绪更克制。检测器看到这些特征,可能会提高怀疑值。
这不是替任何一方开脱,而是要把证据放回它能承受的位置。
AI 检测器擅长发现统计异常,但它很难还原写作过程。多人协作、翻译润色、模板化公文、语法工具修改,都可能改变文本特征。
教育场景已经吃过这个亏。Turnitin、GPTZero 等工具被用于筛查学生作业后,一直有争议。非英语母语写作者、格式规整的学术文本、经过语法软件润色的文章,都可能更容易被打上 AI 标签。
所以,这次最稳妥的说法是:Pangram 给出了可疑判断,但还不足以证明来源。
如果媒体、学校或机构把“工具标记”直接写成“事实发生”,就会多出一层风险:不是查清问题,而是把算法的猜测包装成结论。
真正被考验的是公共文本的信任流程
这件事最直接影响的,不是普通读者每天要不要用 AI,而是两类人。
一类是新闻编辑和事实核查人员。以后遇到类似文本,不能只写“AI 检测器判定为 AI”。更准确的写法应该区分三件事:工具怎么判、样本怎么取、有没有独立证据。
另一类是宗教机构、大学、政策部门这类发布高关注度文本的团队。他们可能要多做几件很具体的事:保存版本记录,保留审稿链路,说明翻译和编辑流程,必要时解释是否使用过自动化工具。
这会增加成本。
过去,署名和机构背书大体能支撑信任。现在不够了。文本一旦被检测器标红,发布方可能需要拿出过程证据,证明自己不是机器代笔。
但反过来也要看到现实约束。不是每个组织都愿意公开内部写作流程,宗教文本和外交文本尤其如此。要求完全透明,未必现实。
所以接下来更该看三件事:
- 不同 AI 检测工具是否给出相近结果;
- 是否出现可核验的写作、翻译或编辑流程信息;
- Pangram 是否能说明,它在宗教文体、翻译文本和多人编辑文本上的误判边界。
没有这些变量,结论就只能停在“文本可疑”。不能再往前推。
这桩风波有一点讽刺感:一份提醒人们警惕 AI 的文本,自己被 AI 检测器怀疑了。
但它真正暴露的不是某一篇通谕的秘密,而是一个更日常的麻烦:人写得太像机器,机器写得太像人,公共信任开始需要额外凭证。
这才是更难处理的部分。
