作为人工智能的"眼睛",计算机视觉技术已成为当前人工智能领域的重要研究方向。最近,计算机视觉领域三大顶级学术会议之一——国际计算机视觉大会(ICCV 2025)成功举办。会议期间,合合信息与上海交通大学等机构联合主办了首届VQualA视觉质量评估研讨会,并设置了文档图像质量评估竞赛,吸引了来自全球知名高校和研究机构的数百名选手参与。
文档图像质量评估竞赛致力于推动开发与人类判断一致的质量评估模型。经过多轮评审,参赛队伍DeQA-Doc提交的技术方案成功将多模态大模型在图像质量评估上的卓越性能延伸应用至文档图像领域,其模型评分位列赛道榜首。
在数字化浪潮下,文档图像已成为信息传播的核心载体。然而,通过手机、相机等设备采集的文档图像常会受到环境光线、拍摄角度等因素干扰,出现阴影、纸张弯曲等问题。智能文档图像处理技术可通过去模糊、几何校正等手段提升画面质量,但如何科学评估这些算法的优化效果仍是行业面临的挑战。传统评估指标与人眼实际感知效果存在偏差,主观评估效率低下,不适合大规模算法评估。本次竞赛中,来自全球的数百名选手针对这一难题提出了多种技术解决方案,助力优化文档处理系统。
AI行业的健康发展既要从长期实践中洞察真实痛点,也需要前沿技术破解特定难题,这也是合合信息与上海交通大学联合举办此次竞赛的初衷。合合信息专注于多模态文本智能技术的研发,此前在智能图像处理等领域,已与上海交通大学围绕"企业出题、高校攻关"的课题研究模式展开持续合作,旨在打通从学术创新到产业应用的转化路径。双方定期开展交流,由公司提出具有产业价值的研究课题,并提供场景、算力等研究资源支持,校方组织团队开展技术研究。合作期间,双方共同产出了数篇前沿学术论文及多项专利成果,有效推动了智能文档图像处理领域的技术突破。
未来,合合信息与上海交通大学将继续深化合作关系,以产业需求为导向,以技术创新为引擎,探索多种形式的合作模式,促进人工智能与计算机视觉领域的前沿技术突破与产业应用落地。
