IT之家 6 月 13 日消息,去年10月,全球四大会计师事务所之一毕马威曾发布一份题为《总体体验:在智能体AI时代重新定义卓越》的报告,重点探讨企业如何借助人工智能满足客户需求。然而近期这份报告却暴露出严重问题。据英国《金融时报》12日报道,该报告被指存在大量AI幻觉——其中列举的多个智能体AI案例要么根本不存在,要么完全不具备毕马威所描述的功能。

AI内容检测工具开发商GPTZero的研究人员在报告中发现了大量错误信息与虚假脚注。这一结论随后也得到了《金融时报》的独立核实与证实。
先介绍背景:毕马威是全球四大专业服务与会计师事务所之一,与德勤、普华永道和安永齐名。但这一次,它在专业声誉上栽了一个大跟头。
调查结果显示,毕马威那份报告共包含45条引文,其中仅有5条能准确对应到真实来源。其余情况则相当离谱:28条引文要么擅自改写真实来源的标题,要么在真实来源中强行塞入原本不存在的内容;另有12条引文表述过于模糊,完全无法确认其出处是否真实。
引文造假只是冰山一角。报告中大约一半的核心主张也存在问题——有的内容虚假,有的归属错误。GPTZero的分析指出,这些错误很可能源于AI研究工具在执行指令时过于“听话”:当被要求查找现实世界中的智能体AI案例时,工具硬性拼凑出了不可靠的结果。
举一个典型例子:毕马威声称阿联酋航空推出了一款名为Sara的移动聊天机器人,能够与乘客对话,并协助乘客改签航班。但实际情况是,Sara只是阿联酋航空在2024年上线的常规移动助手,根本不是真正的AI聊天机器人,更不具备修改订票的功能。
类似的“货不对板”案例还有不少。毕马威称,瑞银已在投资咨询、风险管理和合规监控中全面整合了智能体技术。瑞银方面的回应极其直接:这“与事实不符”。另一个案例涉及瑞士联邦铁路SBB。毕马威声称SBB拥有一个AI智能体,可根据乘客偏好、实时状况以及碳排放影响,帮助乘客规划、预订并优化行程。SBB发言人的回应则是:“不准确。”
GPTZero首席执行官爱德华·田对此发出警示:如果“四大”这类顶级机构发布的报告都充斥错误数据,后果将是“污染信息源”,进而引发更多二次AI幻觉。这意味着错误会像雪球一样越滚越大,危害整个行业的信息可信度。
面对质疑,毕马威发言人的回应较为谨慎:公司严肃对待所发布内容的准确性与完整性。不过,行动倒是相当迅速——毕马威目前已直接撤下该报告,并启动了对“报告发布前后情况”的内部审查。
