蚂蚁开源LingBot-Depth:新一代掩码深度建模空间感知模型
蚂蚁集团旗下具身智能企业灵波科技正式对外开源其高精度空间感知模型 LingBot-Depth。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据悉,LingBot-Depth 是一款专为真实应用场景设计的深度补全模型,依托奥比中光 Gemini 330 系列双目 3D 相机完成 RGB-Depth 数据采集与效果验证,并基于深度引擎芯片直接输出的原始深度数据开展训练与调优,旨在将存在缺失、噪声干扰的原始深度传感器信号,重建为高保真、具备真实物理尺度的三维测量结果,从而显著增强智能体对环境的深度理解与三维空间建模能力,为服务机器人、自动驾驶车辆等终端设备提供更鲁棒、更精确的三维视觉支撑。
LingBot-Depth 核心优势
- 高精度与高鲁棒性的相机深度感知能力
- 优异的 3D 静态感知与 4D 动态场景理解性能
- 支持对透明、反光等难抓取物体的灵巧操作
实验数据显示,该模型在深度预测精度与有效像素覆盖率两大关键指标上,全面超越当前主流工业级深度相机。在 NYUv2、ETH3D 等多个权威基准测试中,LingBot-Depth 在深度补全、单目深度估计以及双目立体匹配任务中均达到 SOTA(State-of-the-Art)水平;尤为值得注意的是,其在未引入显式时序建模机制的前提下,仍能保持视频序列级的时间一致性表现。
该模型已通过奥比中光深度视觉实验室的专项评测认证,在测量精度、运行稳定性及复杂光照/纹理场景下的泛化适应性等方面,均达到行业领先水准。

在最具难度的稀疏深度补全任务中,LingBot-Depth 的综合性能优于当前多种主流方法。(图中数值越小,表示误差越低、性能越优。)下游任务实测进一步证实:模型可在 RGB 与深度两种模态间学习到高度对齐的隐空间表征,从而实现对透明与镜面反射类物体的可靠识别与稳定抓取。
据 LingBot-Depth 研发团队介绍,其核心技术之一为“掩码深度建模”(Masked Depth Modeling, MDM)。尽管训练数据为大规 RGB–深度图像对,但在训练过程中主动对部分深度区域进行随机遮挡,迫使模型仅依据 RGB 图像内容来推理并重建被遮挡的深度信息。随着训练推进,模型逐步建立起“外观–几何结构”的强关联映射,即实现从“物体视觉外观特征”出发,准确推断其空间位置与距离关系。

LingBot-Depth 模型权重、完整训练/推理代码、技术白皮书均已面向全球开发者开源:
Website:
Model:
Code:
Report:
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





