来源:科技日报
科技日报记者 崔爽
1月27日,蚂蚁集团旗下具身智能公司灵波科技开源了高精度空间感知模型 LingBot-Depth。继在2025外滩大会上首次亮相后,时隔半年,灵波科技在具身智能技术底座方向再次公布重要成果。
据介绍,该模型基于奥比中光 Gemini 330 系列双目3D相机提供的芯片级原始数据,专注于提升环境深度感知与三维空间理解能力。其目标是为机器人、自动驾驶汽车等智能终端赋予更精准、可靠的三维视觉,助力攻克“看清楚”三维世界这一行业难题。在 NYUv2、ETH3D 等权威基准评测中,LingBot-Depth 在室内场景的相对误差显著降低超过70%。
在家庭和工业环境中,玻璃器皿、镜面和高反光物体十分常见,但这些恰恰是机器空间感知的传统难点。受限于光学物理特性,传统深度相机在面对透明或高反光材质时,往往无法接收有效回波,导致深度图出现数据缺失或噪声干扰。
针对这一挑战,灵波科技研发了“掩码深度建模”技术,并依托奥比中光 Gemini 330 系列双目3D相机进行 RGB-D 数据采集与效果验证。当深度数据出现缺失或异常时,LingBot-Depth 模型能够融合彩色图像中的纹理、轮廓及环境上下文信息,对缺失区域进行推断与补全,最终输出完整、致密、边缘更清晰的三维深度图。值得一提的是,该模型已通过奥比中光深度视觉实验室的专业认证,在精度、稳定性及复杂场景适应性方面均达到行业领先水平。
据了解,灵波科技已与奥比中光达成战略合作意向。奥比中光计划基于 LingBot-Depth 的能力推出新一代深度相机。灵波科技也将陆续开源多款具身智能方向模型。
