游乐游手机版
首页/业界动态/文章详情

EndoDDC扩散模型实现内窥镜稀疏到稠密深度重建

时间:2026-05-27 22:30
机器人领域顶级学术会议IEEE国际机器人与自动化会议(ICRA 2026)传来喜讯,香港中文大学任洪亮教授团队的研究成果《EndoDDC:通过扩散深度补全实现内窥镜机器人导航的稀疏到稠密重建》成功入选。该研究精准切入微创手术中的关键技术瓶颈,为提升内镜机器人的自主导航精度与可靠性提供了创新解决方案。

机器人领域顶级学术会议IEEE国际机器人与自动化会议(ICRA 2026)传来喜讯,香港中文大学任洪亮教授团队的研究成果《EndoDDC:通过扩散深度补全实现内窥镜机器人导航的稀疏到稠密重建》成功入选。该研究精准切入微创手术中的关键技术瓶颈,为提升内镜机器人的自主导航精度与可靠性提供了创新解决方案。

ICRA 2026

论文题目:EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Na vigation via Diffusion Depth Completion

论文作者:林胤恒†(香港中文大学),黄一鸣†(香港中文大学),崔贝雷(香港中文大学), 白龙(阿里巴巴达摩院,香港中文大学), 高沪昕(香港中文大学),任洪亮(香港中文大学), 赖捷文*(香港中文大学)

论文简介

在微创外科手术(MIS)中,内镜机器人的精准导航是提升手术操作精度、减少组织损伤并保障患者安全的关键。实现精准导航的核心前提在于获取高质量、高可靠性的三维深度信息。然而,内窥镜手术环境复杂,常面临组织表面弱纹理、镜面高光反射、动态流体干扰等挑战,使得传统的单目或双目深度估计方法效果受限,成为制约手术机器人智能化发展的技术难点。现有解决方案或严重依赖难以大规模获取的稠密深度标注数据,或在复杂真实内镜场景下鲁棒性欠佳,导致从稀疏点云到稠密深度图的重建质量难以满足临床导航需求。

为此,香港中文大学团队提出的EndoDDC方法,旨在攻克上述难题。该方法创新性地融合RGB图像信息、稀疏深度点云以及深度梯度特征,并引入先进的扩散模型(Diffusion Model)对深度图进行迭代优化,有效应对了内镜场景下弱纹理和反射干扰带来的深度估计不准问题。

主要贡献

EndoDDC的核心贡献在于,它专门为内窥镜场景设计了一套端到端的稀疏到稠密深度重建框架。该框架有效规避了传统监督学习方法对大量稠密标注数据的依赖,同时也解决了自监督深度估计中常见的尺度模糊问题。这意味着,系统仅需输入单帧RGB图像和对应的稀疏深度测量点,即可输出高精度、细节丰富的稠密深度图,极大增强了其在真实手术机器人系统中的实用性与易用性。

方法的一大创新点是深度梯度融合模块(Depth Gradient Fusion Module)。该模块利用卷积门控循环单元(ConvGRU),以迭代方式融合深度值信息与深度梯度特征,为整个重建过程提供了精确的几何结构引导。这一设计对于恢复弱纹理区域(如光滑器官表面)的连续几何形状起到了至关重要的作用。

此外,研究团队提出了基于深度梯度条件的扩散模型(Depth-conditioned Diffusion Model)。该模型以初步预测的粗糙深度图为起点,利用提取的深度梯度特征作为条件,引导扩散模型的反向去噪过程,通过多轮迭代优化,最终生成全局一致且符合物理约束的高质量稠密深度图。

为了验证方法的有效性,研究在C3VD和StereoMIS这两个权威的公开内镜数据集上进行了全面评估。实验结果表明,在RMSE(均方根误差)、MAE(平均绝对误差)、REL(相对误差)和δ准确率(δ<1.25)等所有核心评估指标上,EndoDDC均显著超越了当前最先进的深度补全与深度估计方法。具体数据上,在C3VD数据集中,相较于此前最优的深度补全模型OGNI-DC,EndoDDC将RMSE降低了5.28%,MAE降低了7.84%。更为突出的是,即使输入深度点的稀疏程度在50至50000个点之间剧烈变化,EndoDDC依然能稳定输出高质量的深度重建结果,展现了其卓越的鲁棒性和广泛的适用性。

ICRA 2026

EndoDDC方法概览和可视化样例

ICRA 2026

EndoDDC 概述:在从 RGB 图像和稀疏深度图提取特征后,Depth Grad Fusion 模块会基于深度和梯度特征迭代地更新状态隐藏网络。然后,将该输出输入到 Depth Diffusion 模型进行条件引导下的补全。

ICRA 2026

在 C3VD 和 STEREOMIS 数据集上与SOTA方法的深度补全结果比较。

ICRA 2026

在 C3VD 和 StereoMIS 数据集上的比较。我们将 EndoDDC 与最先进的深度估计和深度补全方法进行比较;我们的方法在组织细节方面产生的误差更少。

参考文献

Lin, Y., Huang, Y., Cui, B., Bai, L., Gao, H., Ren, H. & Lai, J. (2026). EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Na vigation via Diffusion Depth Completion. ICRA 2026.

来源:https://www.leiphone.com/category/robot/Za9QbzbFSiyEsgaL.html
上一篇尚界Z7碰撞测试首测 螺旋翻滚夹击下ABC柱结构完整 下一篇2026年新能源企业高端官网设计开发服务商
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿