近期,备受瞩目的计算机视觉学术会议ICCV 2025公布了RealADSim挑战赛的最终结果。小米汽车团队在"外推新视角合成"项目中表现亮眼,从全球18支高水平参赛队伍中脱颖而出,最终斩获冠军。
作为两年一度的重要国际会议,ICCV始终专注于推动计算机视觉技术的发展。本届RealADSim挑战赛重点关注自动驾驶仿真等关键领域的技术难点。当前,自动驾驶算法验证面临着显著瓶颈:传统仿真方法往往难以准确还原真实道路环境,或无法支持闭环交互;尽管新兴视角合成技术具备构建四维动态场景的潜力,但在进行视角外推时,普遍存在画面真实感不足与几何结构失真的问题。
为应对这些挑战,小米汽车团队提出了一套基于3D高斯泼溅(3DGS)的技术框架,并构建了包含四个阶段的创新处理流程。该方案首先利用视觉信息生成"伪点云",实现无需依赖激光雷达点云数据的初始化建模,有效避免了因初始数据局限导致的优化偏差。为进一步提升几何一致性,团队引入2D-SDF路面模型,嵌入道路结构的几何先验知识,确保外推视角下的空间合理性。
在优化渲染质量方面,团队设计了"伪真值"监督机制,用于识别并修复外推过程中出现的视觉缺陷。同时,结合时序不变适应网络,削弱光照变化、时间动态因素对生成结果的干扰,增强了跨时间段场景的稳定性。
实验结果表明,该方案在多项核心指标上达到领先水平:PSNR达18.228,SSIM为0.514,LPIPS低至0.288。尤其值得注意的是,该技术在完全不使用激光雷达数据的前提下,仍然实现了高精度的环境建模,展现出强大的实用性与推广价值,为自动驾驶领域的高保真仿真提供了新的技术路径。
