KPMG因AI幻觉问题撤回AI使用报告
速览
KPMG近日撤回了一份关于AI使用的报告,原因是其中包含明显的AI幻觉内容。这一事件再次表明,AI在提供关于自身的信息时仍不可靠。该案例揭示了当前AI生成内容在专业领域应用中的潜在风险。
AI 深度解读
KPMG 撤下 AI 报告:当专业服务巨头陷入“AI 幻觉”泥潭
背景
近期,全球四大会计师事务所之一的 KPMG(毕马威)面临了一场由其自身发布的内容引发的公关危机。该公司撤下了一份题为《在代理式 AI 时代重新定义卓越》(Redefining excellence in the age of agentic AI)的行业报告。该报告最初于 2025 年 10 月发布,旨在探讨人工智能在企业中的应用前景。然而,发布后不久,多家被报告提及的企业纷纷向外界澄清,报告中关于它们使用 AI 技术的描述严重失实,甚至完全虚构。这一事件迅速引发了业界对大型专业服务公司在使用生成式 AI 进行内容创作时缺乏有效监管的广泛质疑。
核心内容
此次事件的核心在于 KPMG 发布的报告出现了大量事实性错误,且这些错误被证实源于 AI 的“幻觉”(hallucinations)。
1. 报告被撤与事实核查 多家权威机构确认,报告中关于特定企业 AI 使用情况的陈述是不真实的。其中包括瑞士银行(UBS)、英国国家医疗服务体系(NHS)、瑞士联邦铁路(Swiss Federal Railways)以及伦敦交通局(Transport for London)。这些机构均向《金融时报》(FT)表示,报告中声称它们采用了某些 AI 技术或处于某种 AI 应用阶段的说法,要么是完全捏造的,要么是极具误导性的。
2. 错误根源:AI 幻觉 专注于检测 AI 生成内容的研究组织 GPTZero 对这份报告进行了深入分析,指出了其中存在的多处不准确信息。GPTZero 向 FT 透露,这些错误并非人为疏忽,而是典型的 AI 幻觉现象。换言之,毕马威似乎直接使用 AI 辅助撰写了一份关于 AI 应用的行业报告,而 AI 模型在缺乏真实数据支撑的情况下,编造了不存在的案例和数据。
3. KPMG 的回应与调查 面对舆论压力,KPMG 发言人发表声明称,公司已在网站上下架该报告,并正在开展内部调查。发言人强调:“我们期望所有员工遵循我们关于负责任使用 AI 的指导方针,包括通过人工监督来验证内容,并核实独立来源的信息。”这一回应间接承认了公司在内容审核流程中可能存在对 AI 生成内容验证不足的问题。
4. 行业先例 值得注意的是,这并非专业服务行业首次因 AI 幻觉陷入困境。上个月,另一家“四大”会计师事务所 EY(安永)也撤下了一份关于忠诚度奖励计划的报告。该报告被指出包含伪造的脚注和明显的 AI 幻觉内容,显示出生成式 AI 在专业咨询领域的应用仍面临严峻的信任挑战。
关键要点
- 报告撤下原因:KPMG 撤下《在代理式 AI 时代重新定义卓越》报告,原因是多家被提及企业(如 UBS、NHS 等)否认报告中关于其 AI 使用情况的描述。
- 技术根源:研究组织 GPTZero 确认,报告中的错误属于典型的“AI 幻觉”,即 AI 模型生成了看似合理但事实错误的内容。
- 涉事机构:除 KPMG 外,被错误关联的企业包括瑞士银行(UBS)、英国 NHS、瑞士联邦铁路和伦敦交通局。
- 公司回应:KPMG 表示正在内部调查,并重申员工需遵循 AI 使用指南,特别是必须进行人工监督和内容验证。
- 行业趋势:继 EY 此前因类似原因(伪造脚注、AI 幻觉)撤回报告后,KPMG 事件表明“四大”会计师事务所正在经历因盲目信任 AI 生成内容而引发的信任危机。
意义与影响
1. 专业服务行业的信任危机 KPMG 和 EY 的事件对专业服务行业构成了重大打击。这些机构的核心价值在于其专业判断、数据准确性和可靠性。当它们发布的报告被证实包含 AI 编造的“事实”时,客户和合作伙伴对其专业性的信任将受到严重侵蚀。这警示业界,在引入 AI 辅助工作时,必须建立更严格的内容审核机制,不能将 AI 视为完全可信的信息源。
2. “AI 幻觉”成为现实商业风险 此次事件将“AI 幻觉”从一个技术术语转化为具体的商业和法律风险。企业若直接使用 AI 生成面向公众或客户的报告,而未进行充分的人工核实,可能面临声誉损失、法律纠纷以及客户流失。这要求企业在 AI 工作流中嵌入强制性的“人在回路”(Human-in-the-loop)验证环节,确保关键事实经过独立来源确认。
3. 对 AI 生成内容(AIGC)监管的推动 随着更多类似案例的出现,监管机构、行业协会以及企业内部合规部门可能会加强对 AIGC 内容的监管要求。未来,企业在使用 AI 生成报告、营销材料或客户沟通内容时,可能需要遵循更明确的披露义务,即明确标注哪些内容是由 AI 生成,并保留人工审核的记录,以证明其尽职调查过程。
4. 技术应用的反思:辅助而非替代 KPMG 发言人提到的“人工监督”至关重要。这一事件再次证明,目前 AI 更适合作为辅助工具,用于头脑风暴、草稿撰写或数据整理,而非直接作为最终内容的生产者。特别是在涉及具体事实、案例引用和数据统计时,必须依靠人类专家的专业知识和独立验证,以避免因模型训练数据的偏差或随机性导致的错误传播。
