安永加拿大报告被指虚假引用：AI 时代，咨询报告也要查脚注了

核心摘要 Summary

GPTZero 5 月 14 日发布调查，指向一份很具体的报告：EY Canada 2025 年发布的《Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems》。

这份报告讲的是会员积分系统里的网络威胁和欺诈风险。按理说，它应该帮助企业判断风控预算、安全采购和积分政策。但 GPTZero 称，报告里有大量疑似 AI 幻觉引用、错误归因和互相打架的数据。

这事目前不是司法或监管定论，也不能外推成“安永全球报告都有问题”。我更在意的是另一层：如果一家知名咨询机构的报告夹带虚假来源，错误不会停在报告里。它会顺着媒体、搜索、AI 摘要和企业 PPT 往下游走。

被指的问题：来源链断了

GPTZero 称，它追查了这份 44 页报告里的引用和资源表，发现多数 URL 失效或疑似虚构，超过半数标题无法对应真实来源。

它还称，报告文本被其工具判定为高度 AI 生成，并出现几类常见问题：虚假统计、错引来源、同一数字前后说法不一致。

最刺眼的是 2000 亿美元这个数字。

报告执行摘要称，全球会员积分市场价值为 2000 亿美元，同时有 30% 至 50% 的积分未被兑换。但到第 10 页，2000 亿美元又变成了全球未兑换积分的估值。

如果后一种说法成立，按 30% 至 50% 的未兑换比例倒推，全球积分总市场至少应是 4000 亿美元。两处说法很难同时成立。

争议点	GPTZero 指称的问题	为什么影响判断
2000 亿美元市场规模	一处指全球会员积分市场，一处指未兑换积分估值	市场盘子和沉淀负债不是一回事
Forbes 引用	被用来支撑 2000 亿美元说法，但 GPTZero 称找不到对应来源	核心数字可能缺少可靠出处
McKinsey 引用	“Loyalty Economics Report (2022)”被指不存在	大公司名义可能给虚构材料增信
72% 欺诈数据	不同页归因给 Paystone 与 Forter，原始来源疑似为 2017 年 Ipsos 调查	风险程度可能被错配或过度使用
89% 增长数据	一处写成 2019 年以来增长，另一处限定为 2018 至 2019 年	趋势判断可能被拉长、改写

引用错一个链接，常见。可如果资源表里出现虚构标题、错配归因、同一数字变换含义，那就不是排版粗心。

咨询报告卖的不是文采，而是筛选和核验信息的能力。脚注一虚，结论的地基就松了。

咨询报告和学术论文不一样。它通常没有同等严格的脚注审查，也未必有清晰的撤稿机制。

但它在现实世界里的用途很硬。

企业安全团队可能拿它做风险判断。风控负责人可能拿它解释预算。政府或公共机构采购人员可能把它放进调研材料。研究人员和媒体也可能把它当成二手事实来源。

这里的成本不是“读者被误导一下”这么轻。

如果一个团队相信会员积分欺诈正在快速上升，它可能提前采购反欺诈系统，调整安全预算，甚至改变积分兑换规则。若基础数据本身站不住，后面的预算分配就会跑偏。

对关注 AI 内容可信度的科技读者，这件事给出的动作很直接：以后看机构报告，不只看品牌和结论，要抽查关键引用。尤其是市场规模、增长率、欺诈比例这类会被反复转述的数字。

对依赖咨询报告做研究或决策的企业与公共机构，更现实的做法是把“来源核验”前移。采购、预算、政策建议进入正式流程前，至少抽查 3 类材料：原始 URL 是否存在、标题是否能对应真实来源、关键数字在报告内是否前后一致。

这会增加一点时间成本。但比事后发现 PPT、立项书和采购依据都引用了可疑来源，要便宜得多。

GPTZero 的角色必须摆在桌面上。

它是 AI 文本检测和幻觉引用检测工具提供方。它的调查文章也推广了自己的 Hallucination Check，并提到该工具已用于 IJCAI、ICLR、ICSE 等会议投稿筛查。

这意味着它有利益相关。它有动力证明“vibe citing”很严重，也有动力让市场相信检测工具必要。

所以，这次调查不能直接当成独立审计，更不能当成监管结论。更稳妥的读法是：它提供了一组可核查的指控，外界应该沿着这些链接、标题和数字去复核。

但反过来，不能因为 GPTZero 有商业立场，就把问题轻轻放过。

报告内容已经被媒体引用。GPTZero 提到，《Canberra Times》报道过这份报告，并经由澳大利亚多家报纸转载。只要进入转载链，错误就会多出几层外衣。

现在还有一个新变量：AI 搜索和摘要工具会抓取公开网页，也会把机构声誉当作可信信号之一。普通网页里的错误，可能只在小范围流动；Big Four 报告里的错误，更容易被系统当成高质量材料。

接下来只看三件硬事。

一是 EY Canada 是否修订、下架或公开说明这份报告。二是被指虚构的 Forbes、McKinsey 来源，能否被独立找到。三是已经引用该报告的媒体、数据库和 AI 搜索结果，是否会同步更正。

如果这三处都没有动作，问题就会从一份报告的写作事故，变成公共知识供应链的质检缺口。

开头那个 2000 亿美元数字，最后其实问的是同一件事：当一个数字披上知名机构的外衣，我们还会不会追问它从哪来。