首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
EndoDDC扩散模型实现内窥镜稀疏到稠密深度重建

EndoDDC扩散模型实现内窥镜稀疏到稠密深度重建

热心网友
76
转载
2026-05-27

机器人领域顶级学术会议IEEE国际机器人与自动化会议(ICRA 2026)传来喜讯,香港中文大学任洪亮教授团队的研究成果《EndoDDC:通过扩散深度补全实现内窥镜机器人导航的稀疏到稠密重建》成功入选。该研究精准切入微创手术中的关键技术瓶颈,为提升内镜机器人的自主导航精度与可靠性提供了创新解决方案。

ICRA 2026

论文题目:EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Na vigation via Diffusion Depth Completion

论文作者:林胤恒†(香港中文大学),黄一鸣†(香港中文大学),崔贝雷(香港中文大学), 白龙(阿里巴巴达摩院,香港中文大学), 高沪昕(香港中文大学),任洪亮(香港中文大学), 赖捷文*(香港中文大学)

论文简介

在微创外科手术(MIS)中,内镜机器人的精准导航是提升手术操作精度、减少组织损伤并保障患者安全的关键。实现精准导航的核心前提在于获取高质量、高可靠性的三维深度信息。然而,内窥镜手术环境复杂,常面临组织表面弱纹理、镜面高光反射、动态流体干扰等挑战,使得传统的单目或双目深度估计方法效果受限,成为制约手术机器人智能化发展的技术难点。现有解决方案或严重依赖难以大规模获取的稠密深度标注数据,或在复杂真实内镜场景下鲁棒性欠佳,导致从稀疏点云到稠密深度图的重建质量难以满足临床导航需求。

为此,香港中文大学团队提出的EndoDDC方法,旨在攻克上述难题。该方法创新性地融合RGB图像信息、稀疏深度点云以及深度梯度特征,并引入先进的扩散模型(Diffusion Model)对深度图进行迭代优化,有效应对了内镜场景下弱纹理和反射干扰带来的深度估计不准问题。

主要贡献

EndoDDC的核心贡献在于,它专门为内窥镜场景设计了一套端到端的稀疏到稠密深度重建框架。该框架有效规避了传统监督学习方法对大量稠密标注数据的依赖,同时也解决了自监督深度估计中常见的尺度模糊问题。这意味着,系统仅需输入单帧RGB图像和对应的稀疏深度测量点,即可输出高精度、细节丰富的稠密深度图,极大增强了其在真实手术机器人系统中的实用性与易用性。

方法的一大创新点是深度梯度融合模块(Depth Gradient Fusion Module)。该模块利用卷积门控循环单元(ConvGRU),以迭代方式融合深度值信息与深度梯度特征,为整个重建过程提供了精确的几何结构引导。这一设计对于恢复弱纹理区域(如光滑器官表面)的连续几何形状起到了至关重要的作用。

此外,研究团队提出了基于深度梯度条件的扩散模型(Depth-conditioned Diffusion Model)。该模型以初步预测的粗糙深度图为起点,利用提取的深度梯度特征作为条件,引导扩散模型的反向去噪过程,通过多轮迭代优化,最终生成全局一致且符合物理约束的高质量稠密深度图。

为了验证方法的有效性,研究在C3VD和StereoMIS这两个权威的公开内镜数据集上进行了全面评估。实验结果表明,在RMSE(均方根误差)、MAE(平均绝对误差)、REL(相对误差)和δ准确率(δ<1.25)等所有核心评估指标上,EndoDDC均显著超越了当前最先进的深度补全与深度估计方法。具体数据上,在C3VD数据集中,相较于此前最优的深度补全模型OGNI-DC,EndoDDC将RMSE降低了5.28%,MAE降低了7.84%。更为突出的是,即使输入深度点的稀疏程度在50至50000个点之间剧烈变化,EndoDDC依然能稳定输出高质量的深度重建结果,展现了其卓越的鲁棒性和广泛的适用性。

ICRA 2026

EndoDDC方法概览和可视化样例

ICRA 2026

EndoDDC 概述:在从 RGB 图像和稀疏深度图提取特征后,Depth Grad Fusion 模块会基于深度和梯度特征迭代地更新状态隐藏网络。然后,将该输出输入到 Depth Diffusion 模型进行条件引导下的补全。

ICRA 2026

在 C3VD 和 STEREOMIS 数据集上与SOTA方法的深度补全结果比较。

ICRA 2026

在 C3VD 和 StereoMIS 数据集上的比较。我们将 EndoDDC 与最先进的深度估计和深度补全方法进行比较;我们的方法在组织细节方面产生的误差更少。

参考文献

Lin, Y., Huang, Y., Cui, B., Bai, L., Gao, H., Ren, H. & Lai, J. (2026). EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Na vigation via Diffusion Depth Completion. ICRA 2026.

来源:https://www.leiphone.com/category/robot/Za9QbzbFSiyEsgaL.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

蚂蚁灵波LingBot-VA论文入选RSS 2026 实现机器人推演与行动同步
AI资讯
蚂蚁灵波LingBot-VA论文入选RSS 2026 实现机器人推演与行动同步

蚂蚁灵波科技与港科大合作的研究被RSS2026接收,提出面向机器人控制的因果世界建模框架,并推出开源自回归视频-动作世界模型LingBot-VA。该模型使机器人能持续预测环境变化并生成动作,实现“边观察、边判断、边行动”的类人能力,在仿真与真实任务中表现出优异的数据效率和泛化能力。

热心网友
05.27
黑芝麻智能AI机器人计算平台荣获国际大奖
AI资讯
黑芝麻智能AI机器人计算平台荣获国际大奖

近日,在新加坡举办的自动化领域年度盛会Automation SolutionGo 2025上,一项来自中国的边缘计算解决方案脱颖而出,荣获年度“GO! Technology Utilisation Winner”(技术应用优胜奖)。获奖方案是黑芝麻智能推出的AI全栈机器人计算平台,展现了其在机器人智

热心网友
05.27
杰和科技LM2-100-V0算力模组如何赋能人形机器人突破性能瓶颈
AI资讯
杰和科技LM2-100-V0算力模组如何赋能人形机器人突破性能瓶颈

人形机器人面临主控算力不足的瓶颈。杰和科技LM2-100-V0算力模组作为专用协处理器,可提供高达25TOPS的额外算力。它主要卸载视觉感知与复杂运动规划等高负荷计算任务,其小巧集成设计与高能效比有助于机器人保持流畅响应与精准控制,从而提升整体性能。

热心网友
05.27
2026年中小企业电销机器人推荐 实测对比性价比易用性与合规性
业界动态
2026年中小企业电销机器人推荐 实测对比性价比易用性与合规性

为中小企业挑选电销机器人,看似复杂,实则只要抓住核心需求就能化繁为简。对于预算有限、缺乏技术团队、又希望高效合规获客的中小企业主而言,关键在于找到一款成本可控、快速上手、稳定可靠的产品。面对市场上琳琅满目的选择,究竟哪一款最适合您的业务?我们基于2026年的市场深度评测,对a va vox、鼎富智能

热心网友
05.27
人形机器人规模化交付开启万台产线与13亿订单新阶段
AI资讯
人形机器人规模化交付开启万台产线与13亿订单新阶段

2025年下半年,人形机器人产业迎来了一个关键的转折点。技术突破、产业链成熟与市场需求开始同频共振,推动着人形机器人走出实验室,进入工厂,从概念验证大步迈向规模化量产。一个全新的“量产加速期”已然到来。 近期一系列标志性事件密集释放出强烈信号:智元机器人累计下线量突破5000台;优必选Walker系

热心网友
05.27

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

如何选择PPT软件:提升演示效果的关键指南
AI教程
如何选择PPT软件:提升演示效果的关键指南

制作PPT用什么软件好?2024年五大主流工具深度评测 无论是职场汇报、学术答辩还是项目路演,一份专业且吸引人的PPT演示文稿都至关重要。面对众多制作工具,如何选择最适合自己的那一款?本文将对五款主流的PPT软件进行全方位对比分析,从功能、协作、设计到易用性,助您根据核心需求做出最佳决策,高效打造令

热心网友
05.27
朗玛信息股价下跌3.16%后市走势分析及投资机会探讨
AI资讯
朗玛信息股价下跌3.16%后市走势分析及投资机会探讨

今日A股市场整体走势偏弱,朗玛信息(股票代码300288)股价同步调整,截至收盘下跌3 16%,全天成交额4783 73万元,换手率为1 77%,公司总市值约为35 21亿元。股价的短期波动,引发了投资者对其核心投资逻辑与未来潜在机会的深入探讨。 异动深度解析:AI医疗战略的机遇与挑战 朗玛信息是市

热心网友
05.27
超级蠕虫大战圣诞老人2攻略 游戏玩法技巧全解析
游戏攻略
超级蠕虫大战圣诞老人2攻略 游戏玩法技巧全解析

《超级蠕虫大战圣诞老人2》是一款休闲益智游戏,攻略涵盖基本操作、关卡解锁与道具使用。玩家需掌握战斗策略与技能升级,熟悉敌人特性和环境机制。合理运用道具并完成隐藏任务可获取奖励,多人模式注重策略博弈。建议多练习并参与社区交流,同时注意游戏时长以保护视力。

热心网友
05.27
Kimi联网搜索排除干扰技巧 精准限定提示词方法
AI资讯
Kimi联网搜索排除干扰技巧 精准限定提示词方法

在Kimi里搜索“2026年北京积分落户政策细则”,如果跳出来的总是房产中介的软文、培训机构的广告或者各种自媒体猜测,那说明默认的联网检索没有经过过滤。想要获得干净、权威的结果,必须主动使用结构化的提示词进行限定。 用结构化提示词锁定权威信源 这一步是关键,直接决定了你看到的信息是来自官方发布渠道,

热心网友
05.27
Qoder编辑器自动保存功能设置与基础配置教程
AI资讯
Qoder编辑器自动保存功能设置与基础配置教程

为避免代码丢失,Qoder编辑器需手动开启自动保存功能。全局设置中可开启开关并选择触发条件,如按时间间隔或窗口失去焦点时保存。还可为特定项目单独配置,覆盖全局设置。若功能失效,需检查文件位置是否只读、用户权限是否足够,并避免直接编辑受保护的系统文件。

热心网友
05.27