GPTZero 5 月 14 日发布调查,指向一份很具体的报告:EY Canada 2025 年发布的《Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems》。
这份报告讲的是会员积分系统里的网络威胁和欺诈风险。按理说,它应该帮助企业判断风控预算、安全采购和积分政策。但 GPTZero 称,报告里有大量疑似 AI 幻觉引用、错误归因和互相打架的数据。
这事目前不是司法或监管定论,也不能外推成“安永全球报告都有问题”。我更在意的是另一层:如果一家知名咨询机构的报告夹带虚假来源,错误不会停在报告里。它会顺着媒体、搜索、AI 摘要和企业 PPT 往下游走。
被指的问题:来源链断了
GPTZero 称,它追查了这份 44 页报告里的引用和资源表,发现多数 URL 失效或疑似虚构,超过半数标题无法对应真实来源。
它还称,报告文本被其工具判定为高度 AI 生成,并出现几类常见问题:虚假统计、错引来源、同一数字前后说法不一致。
最刺眼的是 2000 亿美元这个数字。
报告执行摘要称,全球会员积分市场价值为 2000 亿美元,同时有 30% 至 50% 的积分未被兑换。但到第 10 页,2000 亿美元又变成了全球未兑换积分的估值。
如果后一种说法成立,按 30% 至 50% 的未兑换比例倒推,全球积分总市场至少应是 4000 亿美元。两处说法很难同时成立。
| 争议点 | GPTZero 指称的问题 | 为什么影响判断 |
|---|---|---|
| 2000 亿美元市场规模 | 一处指全球会员积分市场,一处指未兑换积分估值 | 市场盘子和沉淀负债不是一回事 |
| Forbes 引用 | 被用来支撑 2000 亿美元说法,但 GPTZero 称找不到对应来源 | 核心数字可能缺少可靠出处 |
| McKinsey 引用 | “Loyalty Economics Report (2022)”被指不存在 | 大公司名义可能给虚构材料增信 |
| 72% 欺诈数据 | 不同页归因给 Paystone 与 Forter,原始来源疑似为 2017 年 Ipsos 调查 | 风险程度可能被错配或过度使用 |
| 89% 增长数据 | 一处写成 2019 年以来增长,另一处限定为 2018 至 2019 年 | 趋势判断可能被拉长、改写 |
引用错一个链接,常见。可如果资源表里出现虚构标题、错配归因、同一数字变换含义,那就不是排版粗心。
咨询报告卖的不是文采,而是筛选和核验信息的能力。脚注一虚,结论的地基就松了。
为什么这会伤到下游决策
咨询报告和学术论文不一样。它通常没有同等严格的脚注审查,也未必有清晰的撤稿机制。
但它在现实世界里的用途很硬。
企业安全团队可能拿它做风险判断。风控负责人可能拿它解释预算。政府或公共机构采购人员可能把它放进调研材料。研究人员和媒体也可能把它当成二手事实来源。
这里的成本不是“读者被误导一下”这么轻。
如果一个团队相信会员积分欺诈正在快速上升,它可能提前采购反欺诈系统,调整安全预算,甚至改变积分兑换规则。若基础数据本身站不住,后面的预算分配就会跑偏。
对关注 AI 内容可信度的科技读者,这件事给出的动作很直接:以后看机构报告,不只看品牌和结论,要抽查关键引用。尤其是市场规模、增长率、欺诈比例这类会被反复转述的数字。
对依赖咨询报告做研究或决策的企业与公共机构,更现实的做法是把“来源核验”前移。采购、预算、政策建议进入正式流程前,至少抽查 3 类材料:原始 URL 是否存在、标题是否能对应真实来源、关键数字在报告内是否前后一致。
这会增加一点时间成本。但比事后发现 PPT、立项书和采购依据都引用了可疑来源,要便宜得多。
不能只信 GPTZero,也不能假装没事
GPTZero 的角色必须摆在桌面上。
它是 AI 文本检测和幻觉引用检测工具提供方。它的调查文章也推广了自己的 Hallucination Check,并提到该工具已用于 IJCAI、ICLR、ICSE 等会议投稿筛查。
这意味着它有利益相关。它有动力证明“vibe citing”很严重,也有动力让市场相信检测工具必要。
所以,这次调查不能直接当成独立审计,更不能当成监管结论。更稳妥的读法是:它提供了一组可核查的指控,外界应该沿着这些链接、标题和数字去复核。
但反过来,不能因为 GPTZero 有商业立场,就把问题轻轻放过。
报告内容已经被媒体引用。GPTZero 提到,《Canberra Times》报道过这份报告,并经由澳大利亚多家报纸转载。只要进入转载链,错误就会多出几层外衣。
现在还有一个新变量:AI 搜索和摘要工具会抓取公开网页,也会把机构声誉当作可信信号之一。普通网页里的错误,可能只在小范围流动;Big Four 报告里的错误,更容易被系统当成高质量材料。
接下来只看三件硬事。
一是 EY Canada 是否修订、下架或公开说明这份报告。二是被指虚构的 Forbes、McKinsey 来源,能否被独立找到。三是已经引用该报告的媒体、数据库和 AI 搜索结果,是否会同步更正。
如果这三处都没有动作,问题就会从一份报告的写作事故,变成公共知识供应链的质检缺口。
开头那个 2000 亿美元数字,最后其实问的是同一件事:当一个数字披上知名机构的外衣,我们还会不会追问它从哪来。
