安永(EY)加拿大分公司发布的一份关于忠诚度计划网络安全的报告,经核查后发现其内容充斥着大量编造的引用、错误的统计数据和前后矛盾的论述。这种被称为“氛围引用”(vibe citing)的做法,即通过人工智能模型无意中生成虚假来源,不仅误导了读者,还可能污染互联网的知识库,对未来的研究和AI检索结果造成负面影响。这起事件凸显了即便信息来自权威机构,也必须进行严格的来源核实。
一份充满问题的报告
安永加拿大发布的这份报告名为《攻击点:揭示忠诚度系统中的网络威胁与欺诈》。尽管署名为三名公司员工,但其内容更像是一系列虚假引用、错误归因、伪造统计数据和AI生成文本的拼凑。
- “氛围引用”: 这个术语指代通过大语言模型(LLM)的幻觉功能,无意中创造出虚假参考文献的行为。
- 来源混乱: 报告没有使用标准的学术脚注,而是直接在文本中引用来源,或将其列在资源表中。然而,几乎所有的URL链接都已失效或根本不存在。
- 疑似AI生成: 报告的文本不仅被工具扫描为AI生成,还充满了常见的AI错误,如伪造数据、内部矛盾和归因错误。
将一篇低质量博客中编造的来源,直接搬到“四大”咨询公司的出版物中,这种行为相当于在洗白一个虚构的信源。
相互矛盾的数据与虚构来源
报告中的许多核心数据都存在严重问题,要么自相矛盾,要么来源无法证实。
1. 关于市场规模的矛盾说法
- 在报告的执行摘要中,作者声称全球忠诚度积分市场价值 $2000亿。
- 然而,在第10页,$2000亿 这个数字又变成了未兑换忠诚度积分的估值。
这两个数字显然是相互冲突的。为了支撑后一个说法,报告引用了一份伪造的麦肯锡报告,而该引用实际上源自一个不知名的金融科技博客。
2. 关于欺诈率的混乱归因
- 报告第6页声称,72% 的客户忠诚度计划报告过盗窃或欺诈,并将来源归于支付处理商 Paystone。
- 但在第11页,同样的统计数据又被归因于另一个来源——数字欺诈预防公司 Forter。
进一步追查发现,这两个来源都不是原始出处。真正的源头似乎是 2017年 由益普索(Ipsos)进行的一项调查,这表明报告引用的数据早已过时。
3. 关于欺诈增长率的模糊表述
报告还声称,忠诚度计划的欺诈攻击自2019年以来增加了 89%。但随后又将这个增长限定在 2018年至2019年 这一年之内。这种对统计数据拙劣的转述,也是AI生成内容的典型特征。
“氛围引用”为何重要
这种做法的危害并不仅限于误导读者或企业客户,它还会产生更深远、更隐蔽的影响。
在线发布报告本质上是将数据注入到互联网这个知识池中。当报告包含虚假信息时,它会“污染源头”,尤其是在报告由知名公司发布并托管在高流量网站上时。
- 欺骗读者: 虚假信息让公众和企业客户对事实产生错误认知。
- 污染知识库: 错误信息一旦被发布,就可能被其他研究人员、博主甚至新闻媒体引用,从而进一步扩散。例如,这份安永的报告已被澳大利亚的60多家报纸联合引用。
- 误导AI系统: 新兴的AI研究工具在选择信源时,可能更容易受到这类数据污染的影响,因为它们依赖的信号与人类不同,更容易被权威网站上的虚假信息所迷惑。
最终,这类事件证明了在信息泛滥的时代,对所有来源进行严格核查比以往任何时候都更加重要——即使信息来自像安永这样的知名机构。