首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
港科大新突破:代码本技术助力AI医学影像更稳定

港科大新突破:代码本技术助力AI医学影像更稳定

热心网友
11
转载
2026-01-29


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这项由香港科技大学(广州)和香港科技大学联合开展的突破性研究发表于2025年的NeurIPS会议,有兴趣深入了解的读者可以通过论文编号arXiv:2601.10124v1查询完整论文。

医学图像分析就像医生看X光片一样,需要准确识别病灶位置。但现在的AI医生面临一个尴尬问题:训练数据太少。医院里标注好的图像就像教科书,数量有限且制作成本昂贵,需要专业医生花费大量时间仔细标记每个病灶。

为了解决这个问题,科学家们想出了一个聪明的办法,叫做半监督学习。这就像让学生既用教科书学习,又通过大量没有标准答案的练习题来提升能力。在这个过程中,有一种叫做"特征丢弃"的技术被广泛使用,它的工作原理类似于故意制造一些"噪音"来增强AI的抗干扰能力。

然而,这种传统的丢弃技术就像调音师调节音响设备一样,需要非常精确地控制"丢弃率"这个参数。如果丢弃得太少,就像音量开得太小,起不到锻炼效果;如果丢弃得太多,就像音量开得震耳欲聋,反而会损坏系统。研究团队通过大量实验发现,当丢弃率超过70%时,AI的表现会急剧下降,甚至产生完全无法使用的结果。

面对这个技术难题,香港科技大学的研究团队提出了一个革命性的解决方案:VQ-Seg。他们的核心创新是用"量化扰动模块"(QPM)来替代传统的丢弃技术。这个新方法就像是把连续的颜色调色板换成了一个有限颜色的调色盒。

具体来说,传统方法就像在一张彩色照片上随机涂黑一些像素点,这种做法虽然能增加难度,但控制不当就会让图片变得面目全非。而新方法则像是把照片先转换成马赛克风格(每个小块用一种代表颜色),然后通过巧妙地交换这些小块的位置来创造变化。这种方法的妙处在于,不管怎么交换,图片的基本信息都不会丢失,只是排列方式发生了变化。

研究团队还设计了一个巧妙的"双分支架构"。这就像让AI同时学习两门课程:一门是图像重建课(学会把马赛克图片还原成原始清晰图片),另一门是病灶识别课(学会在图片中找到病变区域)。通过同时学习这两门课程,AI不仅能保持对图像细节的敏感度,还能增强对病灶特征的识别能力。

更进一步,研究团队还引入了一个"语义对齐器"(PFA),它的作用就像给AI配备了一位经验丰富的老师。这位老师来自于预训练的视觉基础模型DINOv2,虽然它原本是在自然图像上训练的,但研究发现它在医学图像上也表现出色。通过这位老师的指导,AI能够更好地理解图像中的高级语义信息,弥补量化过程中可能丢失的细节。

为了验证新方法的有效性,研究团队收集了一个大规模的肺癌数据集,包含828个CT扫描样本,专门标注了中心型肺癌的位置。这个数据集的建立本身就是一项重要贡献,为肺癌AI诊断研究提供了宝贵资源。

实验结果令人印象深刻。在只使用5%标注数据的情况下,VQ-Seg的Dice得分达到了0.6643,显著超过了当前最好方法Unimatch的0.6493。这个提升虽然看似微小,但在医学图像分析领域,即使1%的提升都可能意味着更多生命的挽救。当使用10%标注数据时,VQ-Seg的优势更加明显,Dice得分提升到0.7852,相比MCNet的0.7555有了近3%的显著提升。

研究团队还进行了详细的消融实验,逐一验证了各个组件的贡献。结果显示,量化扰动模块将基础模型的Dice得分从0.7443提升到0.7701,双分支架构进一步提升到0.7784,而语义对齐器则贡献了额外的性能提升。当所有组件结合使用时,最终模型达到了最佳性能。

从理论角度来看,研究团队还提供了严格的数学证明。他们通过KL散度分析表明,传统的丢弃方法在高丢弃率下会导致特征分布的剧烈变化,而他们的量化扰动方法则能保持分布的稳定性。这就像传统方法是在暴风雨中航行,而新方法则是在微风中前进,虽然都有扰动,但后者更加可控和安全。

除了在自建的肺癌数据集上取得突破,VQ-Seg在公开的ACDC心脏图像数据集上也表现出色,进一步证明了方法的通用性。这种跨领域的成功表明,该方法不仅适用于肺癌诊断,还可能在其他医学图像分析任务中发挥重要作用。

研究团队还通过可视化分析展示了代码本的演化过程。初始阶段,只有3.4%的代码被激活使用,随着训练进行,使用率逐渐提升到67%,最终达到98%。这个过程就像一个图书馆逐渐被充分利用,从最初只有少数几本书被借阅,到最后几乎每本书都发挥了作用。

值得注意的是,VQ-Seg在不同标注数据比例下都保持了稳定的性能优势。即使在标注数据充足的情况下,它仍然能够超越传统的全监督方法,这说明该方法不仅在数据稀缺时有效,在数据丰富时也能带来额外收益。

当然,这项研究也存在一些局限性。当前的扰动操作只能在离散的量化空间中进行,难以直接扩展到连续特征表示。此外,引入基础模型虽然带来了语义信息的增强,但也增加了计算开销。

研究团队表示,未来的工作将聚焦于开发可在连续空间中工作的可控扰动机制,并探索更高效的基础模型集成方法。他们相信,随着这些技术的进一步完善,AI在医学图像分析领域的应用将变得更加准确和可靠。

说到底,这项研究就像为医学AI领域带来了一套全新的"工具箱"。传统的工具虽然有效,但使用起来需要小心翼翼,稍有不慎就可能出问题。而新工具不仅更加稳定可靠,还能在各种复杂情况下保持良好性能。这对于医生们来说意味着什么呢?未来他们将拥有更加智能和可靠的AI助手,能够在CT扫描中更准确地识别肺癌等疾病,从而为患者提供更及时有效的治疗。对于医学AI研究领域而言,这套新方法也为其他类似问题的解决提供了有价值的思路和工具。有兴趣深入了解技术细节的读者,可以通过前述论文编号查阅完整的研究报告。

Q&A

Q1:VQ-Seg和传统医学图像分析方法有什么不同?

A:VQ-Seg最大的不同在于用"量化扰动"替代了传统的"随机丢弃"技术。传统方法像在图片上随机涂黑像素,控制不当就会损坏图像信息。而VQ-Seg先把图像转换成离散的"代码本"形式,然后通过交换代码位置来创造变化,这样既能增加训练难度,又不会丢失关键信息,使AI训练更稳定可控。

Q2:为什么VQ-Seg在医学图像标注数据很少的情况下效果更好?

A:VQ-Seg采用了"双分支架构",让AI同时学习图像重建和病灶识别两个任务。这就像让学生既学理论又做实践,通过图像重建任务提供额外的自监督信号,即使标注数据少,AI也能从大量未标注图像中学到有用信息。再加上引入预训练模型作为"语义老师",进一步提升了学习效果。

Q3:VQ-Seg能应用到其他疾病的诊断吗?

A:研究结果显示VQ-Seg具有很好的通用性。除了在肺癌CT图像上表现出色,它在心脏MRI图像的ACDC数据集上也取得了最佳成果。这说明该方法不仅限于特定疾病,而是一个通用的医学图像分析框架,理论上可以应用到各种医学影像诊断任务中。

来源:https://www.163.com/dy/article/KKD665HL0511DTVV.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

量子计算机模拟数据与经典实验结果高度一致再获验证
科技数码
量子计算机模拟数据与经典实验结果高度一致再获验证

来源:科技日报科技日报记者 张佳欣据英国《自然》 30日消息,来自美国和法国的两项最新研究利用真实材料进行实验,将实验结果与量子计算机模拟数据进行对比。最终显示,模拟数据与传统实验结果高度一致,验证

热心网友
04.01
香港科技大学团队突破实时视频生成关键技术
科技数码
香港科技大学团队突破实时视频生成关键技术

这项由香港科技大学、京东探索研究院和香港大学联合开展的研究发表于2026年3月,论文编号为arXiv:2603 17051v1。有兴趣深入了解的读者可以通过该编号在学术数据库中查询完整论文。制作一段

热心网友
03.31
伊利诺伊大学香槟分校破解AI训练难题:五大技巧让机器学习更稳定
科技数码
伊利诺伊大学香槟分校破解AI训练难题:五大技巧让机器学习更稳定

当我们开车在高速公路上行驶时,最怕遇到的就是车子突然失控,方向盘变得异常敏感,稍微一动就可能冲出车道。这种情况在人工智能的训练过程中也经常发生,特别是在训练那些能够进行推理和对话的大型语言模型时。来

热心网友
03.31
石溪大学新研究:状态空间模型能否挑战Transformer的视觉语言主导地位?
科技数码
石溪大学新研究:状态空间模型能否挑战Transformer的视觉语言主导地位?

这项由Stony Brook大学研究团队开展的前沿研究发表于2026年3月,论文编号为arXiv:2603 19209v1,为我们重新审视视觉语言模型的设计理念提供了全新视角。当我们谈到让计算机同时

热心网友
03.31
智能科学家:解读瞭望科技趋势,赋能未来发展
科技数码
智能科学家:解读瞭望科技趋势,赋能未来发展

  面对火星制氧催化剂研发中高达376万种的潜在配方组合,以人工方式一一试验2000年也难以穷尽筛选。“小来”通过自主阅读分析5万篇论文,融合实验与理论计算数据,用6周便找到了最优解  应通过政策引

热心网友
03.30

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

同“芯”聚力,华硕携双系列创新成果,亮相英特尔新品分享会
科技数码
同“芯”聚力,华硕携双系列创新成果,亮相英特尔新品分享会

第三代英特尔酷睿Ultra处理器发布会解析:开启AI PC新时代 近日,一场备受瞩目的科技盛会在上海举行。以“AI PC 变革未来”为主题的第三代英特尔酷睿Ultra处理器新品分享会,汇聚了行业目光。华硕电脑PC&智能创新产品事业群副总经理杨鉴文亲临现场,分享深度见解。他详细解读了面向2026年的华

热心网友
04.02
燕云十六声悬索游天能力怎么解锁-燕云十六声悬索游天能力解锁途径
游戏资讯
燕云十六声悬索游天能力怎么解锁-燕云十六声悬索游天能力解锁途径

悬索游天能力解锁全攻略 在《燕云十六声》的广阔天地中,悬索游天能力无疑是打开全新探索维度的一把关键钥匙。这项酷炫的移动技能,能让你在冒险旅程中如虎添翼。那么,如何才能真正掌握它呢?答案就藏在以下几个核心途径里。下面这份详尽的指南,将带你一步步揭开谜底。 探索主线剧情 主线剧情是解锁一切高级能力的基石

热心网友
04.02
机械革命星耀14UX7 358H版开启预约,4月10日正式发售
科技数码
机械革命星耀14UX7 358H版开启预约,4月10日正式发售

机械革命星耀14酷睿Ultra版正式开售:1公斤极致轻薄,38W性能释放强劲 2024年春季,备受关注的机械革命星耀14迎来了全新的英特尔酷睿Ultra X7 358H配置版本,现已在主流电商平台全面开启预售。这款新品成功地将约1公斤的超便携机身与高达38瓦的持续高性能输出融为一体,重新定义了轻薄本

热心网友
04.02
玩家使用1GB显存显卡玩《赛博朋克2077》 竟能有40帧!
游戏资讯
玩家使用1GB显存显卡玩《赛博朋克2077》 竟能有40帧!

1GB显存显卡流畅体验《赛博朋克2077》 实测帧数超40帧优化指南 硬核玩家总是热衷于突破硬件极限。近期,一位技术爱好者成功完成了一项看似不可能的任务:使用仅配备1GB显存的经典显卡流畅运行《赛博朋克2077》。他选择了AMD Radeon R7 370这张老卡作为测试平台,目标不仅是在夜之城点亮

热心网友
04.02
解禁在即!《极限竞速:地平线6》首批评测与实机演示下周公布
游戏资讯
解禁在即!《极限竞速:地平线6》首批评测与实机演示下周公布

解禁在即!《极限竞速:地平线6》首批评测与实机演示下周公布 赛道准备就绪!备受全球玩家期待的开放世界赛车游戏《极限竞速:地平线6》,即将迎来首次全面曝光。根据官方安排,游戏的首批评测与实机演示内容将于北京时间4月8日晚上10点正式解禁。届时,众多已提前体验游戏的知名媒体与内容创作者,将同步发布他们的

热心网友
04.02