继今年早些时候发布全球首个面向信贷场景的多模态评测基准FCMBench-V1.0与V1.1后奇富科技近日再推重磅成果正式发布信贷场景专属的视频评测任务FCMBench-Video-V1.0旨在通过视频任务推动信贷AI评测从“看懂一张图”进阶到“理解一段过程”。这为信贷场景中的视频理解能力提供了一把可量化的新标尺标志着AI评测从“静态识别”向“动态研判”迈出了关键一步。ench-Video还创新性加入“防忽悠”测试专门检验模型的反欺诈能力。测试中研究人员会在视频末尾故意添加“已核实通过”等误导性提示观察模型会不会因此忽略前面发现的风险。结果显示不同模型的反欺诈能力差距悬殊且暂无通用方法能规避此类误导这一发现直接点明视频AI模型的安全性需专项测试、持续优化为行业技术迭代指明了关键方向。在数据构建层面FCMBench-Video延续了来源于业务、服务于业务的原则同时进一步平衡了真实性与合规性之间的关系。通过模拟真实拍摄过程结合多种现实环境下的画质变化并在此基础上构建不同复杂度的视频样本使评测既具备真实世界的挑战性又避免涉及敏感信息。这种方法不仅保证了评测结果的参考价值也为行业提供了一种可复制的数据构建路径。从整体评测结果来看当前主流视频多模态模型之间仍存在较大能力差距即使是表现最优的模型在部分关键任务上也未达到可以直接应用于生产环境的水平。这意味着视频理解能力在信贷场景中的落地仍处于早期阶段更印证了FCMBench-Video具备极强的能力区分度能精准衡量模型的真实水平与提升空间为企业技术选型、科研机构研究提供权威参考。作为FCMBench评测基准的重要组成部分FCMBench-Video延续开放共享理念配套数据集与工具已同步开源开放旨在汇聚更多科研工作者及行业机构参与信贷AI能力建设为信贷AI技术落地实际应用搭建坚实桥梁。需要说明的是当前版本的FCMBench-Video所覆盖的文档视频分析仅为信贷场景视频分析任务的细分维度之一。本次任务设计提炼自奇富科技当前迭代打磨中的视频尽调AI产品。AI视频尽调不仅要求模型具备准确的文档内容理解能力更需要对企业经营现场开展全方位综合研判涵盖厂房环境、生产设备、原料库存、工艺流程、人员作业状态等关键维度进而推演企业真实经营现状、偿债履约水平及潜在经营风险。这类真实业务诉求对视频尽调AI模型的产业化落地提出了更高标准与全新挑战。FCMBench-Video所构建的评测方法论能够助力复杂视频尽调场景筑牢核心技术底座推动多模态信贷AI评测从“看懂一张图”升级为“理解一座工厂”逐步完善覆盖信贷全业务流程的评测能力体系实现评测基准源于业务场景、赋能业务落地。