信贷领域的AI风控技术正经历一次关键的范式跃迁。过去,行业关注点在于模型能否“精准识别一张图”,例如验证身份证或营业执照的真伪。然而,随着欺诈手段的不断演进,仅凭静态图片识别已显不足——一张经过精心PS的图片或许能欺骗系统,但一段由用户手持拍摄的动态视频却会暴露诸多破绽:人物动作是否流畅自然、环境光线变化是否符合逻辑、纸张翻页时呈现的物理褶皱与光影效果,这些蕴含在连续帧中的动态真实性信息,极难被完美伪造。

正是洞察到这一核心差异,奇富科技在推出面向信贷场景的多模态评测基准FCMBench之后,近期正式发布了其视频评测任务FCMBench-Video-V1.0。这标志着AI风控评测正式从“静态图像识别”迈入“动态视频研判”的新纪元,为客观评估模型在复杂视频内容理解上的综合能力,提供了一套可量化、可比较的权威标准。
那么,从图片到视频,技术挑战究竟升级在何处?关键在于时间维度的引入。视频不仅提供了更多的画面信息,更带来了信息在时间轴上的动态组织与逻辑关联。这意味着模型需要具备一系列全新的复合认知能力:它不仅要准确识别视频帧中的物体与文字,还必须理解这些元素在何时出现、是否重复出现、前后信息是否逻辑一致,以及在存在画面抖动、光线变化、遮挡干扰等复杂情况下能否保持稳定的分析与判断力。这些能力直接关系到信贷反欺诈流程中的核心风控环节,也是传统以静态图片为主的评测体系难以有效覆盖的能力盲区。
通过一个具体场景可以更清晰地理解。在一段用于身份核验或资料审核的视频中,如果同一份证件在镜头前反复出现多次,优秀的模型需要具备“智能去重”能力,而非机械地重复计数;如果视频中连续展示了多份关联文件(如营业执照、财务报表、租赁合同),模型则需要具备“交叉验证”或“智能对账”能力,比对不同文件间的关键信息是否存在矛盾;更为关键的是,当模型最终判定某项资料存在风险时,它应能实现“决策可追溯”,明确指出“判断依据来源于视频第几秒至第几秒的画面”。这已超越了基础的识别任务,演变为一项对模型的时序记忆、逻辑推理与综合研判能力的深度考验。
尤为值得关注的是,FCMBench-Video创新性地引入了“抗干扰”或“防误导”测试模块,专门用于检验模型在反欺诈场景下的决策韧性与鲁棒性。测试中,研究人员会在视频末尾刻意添加诸如“资料已审核通过”、“此人信誉良好”等带有强烈倾向性的误导性文本或语音提示,观察模型是否会因此动摇,而忽略在前序视频片段中已识别出的风险线索。初步测试结果颇具启发性:不同模型在此项抗干扰测试上的表现差异显著,且目前尚未发现能完全免疫此类误导的通用解决方案。这一发现直接揭示了视频AI模型在安全性上面临的独特挑战,强调了对其进行专项对抗测试与持续优化的重要性,为整个行业的技术演进指明了关键攻坚方向。
在评测数据构建层面,FCMBench-Video始终坚持“源于真实业务、服务风控实战”的原则,并在数据真实性与用户隐私合规性之间取得了更优的平衡。它通过高度模拟真实业务中的拍摄场景与流程,结合多种现实环境下常见的画质变化(如对焦模糊、运动抖动、光线明暗变化等),构建了不同难度层级的视频样本库。这种方法既确保了评测任务具备真实世界的复杂性与挑战性,又完全避免了使用真实用户敏感信息,不仅使评测结果对业务落地更具指导价值,也为行业提供了一条可借鉴、可复制的合规数据构建路径。
从首轮评测的整体结果分析,当前主流的视频多模态模型在信贷场景下的能力表现仍存在显著差距。即便是综合表现领先的模型,在部分关键性任务(如复杂环境下的信息一致性校验、长时序依赖推理等)上,其准确率与鲁棒性尚未达到可直接应用于高要求生产环境的水平。这恰恰说明,深度视频理解能力在信贷风控等金融场景的落地应用仍处于早期探索与攻坚阶段。同时,这也印证了FCMBench-Video评测体系具备出色的能力区分度,能够精准、客观地衡量不同模型的真实技术水平与亟待提升的空间,为金融机构的技术选型、供应商评估以及科研机构的技术研究方向提供了极具价值的权威参考。
作为FCMBench多模态评测体系的核心组成部分,FCMBench-Video延续了其开放、共享、协作的理念,相关的评测数据集与配套工具已同步向业界开源。此举旨在汇聚更广泛的科研智慧与行业实践经验,共同推动信贷领域AI视频理解与风控技术的进步,为前沿技术最终实现规模化、安全可靠的业务应用搭建坚实的桥梁。
需要特别说明的是,当前版本的FCMBench-Video所聚焦的“文档类视频分析”,仅是信贷场景下视频分析任务的一个关键细分维度。其任务设计灵感,直接提炼自奇富科技内部正在持续迭代打磨的AI视频尽调产品。真实的AI视频尽调应用,对模型能力的要求远不止于理解文档——它需要对企业的实际经营现场进行全方位、多维度的综合研判,评估范围涵盖厂房环境、生产设备状态、原材料库存水平、工艺流程规范性、一线人员作业状态等关键经营维度,进而深度推演企业的真实运营健康状况、可持续偿债能力及潜在风险点。这类高度复杂的业务诉求,对视频尽调AI模型的产业化落地提出了前所未有的高标准与全新挑战。
可以说,FCMBench-Video所构建的这套评测方法论,其深远价值在于为应对上述复杂业务场景筑牢了核心的技术评估与能力进化底座。它的长期目标,是推动多模态信贷AI评测从“看懂一张静态图片”,逐步升级为“理解一段动态流程”,乃至最终“研判一个完整经营场景”,从而构建起一个覆盖贷前、贷中、贷后全业务流程的、立体化的AI能力评测体系,真正实现“评测基准源于业务痛点,评测结果赋能业务落地”的闭环。
