2025年11月29日,计算机视觉领域的顶级学术会议ICCV 2025公布了RealADSim挑战赛的最终排名。在“外推新视角合成”赛道上,小米汽车团队凭借关键技术突破,从全球18支参赛队伍中脱颖而出,斩获冠军。
作为每两年举办一次的国际顶级学术会议,ICCV长期聚焦于计算机视觉与模式识别领域的前沿研究。本届RealADSim挑战赛围绕自动驾驶仿真中的关键技术瓶颈展开命题。当前,传统仿真手段往往难以兼顾真实场景还原与闭环交互能力,而新兴的新视角合成技术虽有望构建动态、连续的4D仿真环境,但在实现大范围视角外推时,仍面临图像真实感不足和几何结构失真的挑战。
针对上述问题,小米汽车团队以3D高斯溅射为核心框架,提出了一套创新的四阶段处理流程。该方案首先通过视觉信息生成“伪点云”,在无激光雷达数据支持的情况下完成场景初始化,有效避免因初始数据缺陷导致的优化偏差。为增强外推视角下的空间准确性,团队引入2D-SDF路面建模方法,嵌入几何先验知识,提升整体结构的一致性表现。
在优化过程中,团队设计了“伪真值”监督机制,用于识别并修正外推区域的视觉瑕疵,显著改善图像质量。同时,结合时序不变适应网络,削弱光照变化、天气波动等时间相关因素对重建结果的干扰,增强系统在复杂动态环境下的鲁棒性。
实验结果显示,小米汽车团队在多项核心指标上表现领先,取得PSNR 18.228、SSIM 0.514、LPIPS 0.288的成绩。尤为值得注意的是,该方案在完全依赖视觉输入、未使用激光雷达辅助的条件下,仍实现了高精度的三维场景建模,为自动驾驶系统的高保真仿真验证提供了具备实用价值的技术路径。
