港科大褚晓文团队医疗AutoML模型参数量更小分类准确率更高

首页

热心网友

转载

2026-05-15

人工智能技术正深刻变革各行各业，其中，医疗健康领域因其对精准与效率的极致追求，成为AI技术落地最具潜力的前沿阵地。如何让智能算法更精准、更高效地赋能临床诊疗，是当前研究与实践的核心课题。

近年来，自动机器学习（AutoML）技术备受关注。它旨在自动化模型设计与参数调优过程，将研究人员从繁复的工程任务中解放出来，已在工业、农业等多个领域证明了其价值。那么，当这项追求效率的技术，遇上对准确性与可靠性要求极高的医学诊断，将产生怎样的化学反应？

香港科技大学（广州）数据科学与分析学域正教授褚晓文及其团队，是这一交叉领域的积极探索者。他们的研究表明，通过驾驭强大的计算能力处理复杂的医疗场景数据，AutoML能够有效辅助医生，减轻其工作负担，推动计算机辅助诊断向更智能、更精准的方向发展，最终提升整体诊疗效率并优化医疗资源配置。

AutoML + 医学：从辅助诊断到效率革命

从疾病辅助诊断、慢性病风险预测到智慧健康管理，人工智能正引领传统医疗研究进入新纪元。其中，“AI+医学影像”作为关键技术分支，其可诊断的病种范围、分析速度与识别准确率均在持续突破。

图注：褚晓文教授

褚晓文教授于1999年获得清华大学计算机科学与技术系学士学位，2003年于香港科技大学计算机科学系获博士学位。2003年至2021年，他在香港浸会大学计算机科学系历任助理教授、副教授、正教授，现任香港科技大学（广州）数据科学与分析学域正教授。他的研究方向涵盖GPU计算、分布式机器学习、云计算与无线网络等，在国际知名期刊与会议上发表论文200余篇，谷歌学术H指数为46，总引用超7900次，并多次荣获IEEE INFOCOM等顶级会议的最佳论文奖。

自2018年起，褚晓文团队便开始探索AutoML在医疗场景的应用。2019年末，新冠疫情全球爆发，给医疗诊断系统带来了空前压力。当时，核酸检测耗时且依赖特定试剂，而基于医学影像的人工诊断则高度依赖医生经验，分析流程长且难以识别早期隐匿病变。

面对这一紧迫需求，团队开始思考：能否利用AutoML技术来提升COVID-19的影像诊断效率？随着公开的胸部X光与CT影像数据集陆续发布，褚晓文与博士研究生贺鑫以此为基础，构建了基于深度学习的COVID-19检测与诊断模型，并对主流数据集与评估指标进行了系统性梳理。

在相关综述论文中，团队从模型任务与影像数据类型两个维度，系统梳理了现有的COVID-19检测诊断模型，并从骨干网络、数据集、影像模态等六个方面进行了深入的对比分析。

然而，一个现实挑战在于：各种人工设计的深度学习模型在不同数据集上表现不一，缺乏一种通用性强、能自适应不同数据特性的神经网络架构。AutoML的应用，正是为了针对特定数据集自动搜索出最优的网络模型，从而大幅降低人工试错与调参的成本。

为了改进基于权重共享的神经架构搜索策略的稳定性，团队提出了一种高效的进化多目标结构搜索框架。同时，针对医疗数据常面临的小样本难题，他们创新性地提出了一个集成自动数据增强与自动网络搜索的一体化新框架。该框架在多个公开COVID-19数据集上均取得了领先的性能表现。

对话褚晓文：深入AutoML的医疗实践

为了更深入地了解AutoML在医疗领域的应用价值与面临挑战，我们与褚晓文教授进行了一次专访。

问：在COVID-19辅助诊断研究中，你们使用的是开源工具还是自研平台？目前预测效果如何，在哪种任务上表现更优？

褚晓文：我们基于微软亚洲研究院开发的NNI早期版本，搭建了自己的分布式AutoML框架，并重构了基础模块以提升代码复用性。后续的研究工作都基于此自研框架展开。

目前，我们主要在CT影像分类任务上进行了充分验证。实验结果表明，通过AutoML搜索得到的模型，不仅参数量更小，其分类准确率也优于许多广泛使用的人工设计卷积神经网络。此前，英伟达团队利用AutoML在医疗影像分割任务上也取得了显著成效。

问：COVID-19传播快，意味着图像数据集需要不断更新扩充。团队如何应对数据的动态增长，并提升模型的泛化能力？

褚晓文：AutoML可以看作是超参数优化、神经架构搜索和数据增强等技术的集成工具箱。我们当前的研究重点集中在神经架构搜索上，即针对给定任务自动寻找最优的模型结构与超参数组合。

医疗数据涉及患者隐私，初期往往规模有限且存在类别不均衡问题。实际上，COVID-19数据集规模的扩大，反而有助于我们搜索到性能更优的模型。我们正在尝试将数据增强技术与神经架构搜索更紧密地结合，以期进一步提升模型的泛化性能。

问：面对医疗数据中常见的噪声和不一致性问题，如何保证算法的准确性与运行效率？

褚晓文：我们前期工作基于3D CT数据集，其噪声表现为切片不含肺部区域、序列顺序错误或存在重复切片等。目前，这类问题主要依赖人工方式进行清洗和修正。自动化数据清理本身是一个重要的研究课题，但我们团队尚未在此方向深入展开。

对于数据不均衡问题，我们采用数据增强和调整类别采样频率的方法来缓解。而数据不一致性带来的核心启示是：数据集本身的质量对最终识别精度的影响，有时甚至超过模型架构的选择。很难设计出一个“万能”的人工模型来完美适配所有数据集。因此，利用AutoML为特定来源的数据集（如来自同一医院、同一型号设备）定制专属模型，是一个极具前景的方向。

问：系统部署的实际难度如何？面对大规模诊断需求，您此前在分布式机器学习（如联邦学习）上的研究是否带来了新的思路？

褚晓文：由于尚未与医疗机构开展实际临床合作，我们的模型还未在真实医院场景中进行部署测试。但在公开数据集的实验中，AutoML确实能够搜索到更轻量化、同时准确率更高的模型。

我们也研究过联邦学习在COVID-19诊断中的应用。模拟实验发现，数据质量较差的参与方（“数据孤岛”）能从联邦学习中获益，但数据质量高的参与方性能提升有限，有时甚至可能因聚合而性能下降。这是一个非常有趣的现象，值得未来深入探究其背后的机理。

问：您当前的主要研究方向是什么？有哪些突出的研究成果？

褚晓文：我目前主要聚焦于高性能机器学习系统。得益于在GPU与分布式计算领域的长期积累，我们团队较早关注大规模分布式机器学习，于2016年研发了早期开源深度学习基准测试系统DLBench，获得了学界与工业界的关注。

随后，我们与企业合作研发了一系列原创的分布式训练加速技术，并在2018年使用2048块GPU，在ImageNet数据集上实现了当时全球最快的图像分类模型训练速度。团队还在分布式机器学习通信优化方面提出了多种高效方法，相关成果发表在IEEE INFOCOM等顶级会议与期刊上，并获得了IEEE INFOCOM 2021最佳论文奖。

问：您从何时开始AutoML研究？主要经历了哪几个阶段？

褚晓文：我们从2018年开始系统调研AutoML。其最吸引人的地方就在于“自动化”这一终极愿景，有望将研究者从枯燥的调参工作中解放出来。

我们的研究大致经历了几个阶段：首先，通过调研数百篇文献，完成了一篇AutoML综述，它已成为国际期刊《Knowledge-Based Systems》近三年来引用和下载量最高的论文之一，对普及AutoML知识起到了一定作用。其次，在神经架构搜索研究热潮中，我们在医学图像分类等任务上验证了其有效性。之后，我们开始更深入地探究模型结构对性能的本质影响，并从系统设计角度致力于提升AutoML的搜索效率和可扩展性。

问：医学场景是团队应用AutoML的第一选择吗？最初是针对哪种疾病展开研究的？

褚晓文：团队涉足医学场景始于2018年。当时，香港发生了一起与皮肤病相关的社会事件。我从媒体报道中了解到，香港公立医疗系统仅有30多位皮肤科专科医生，却要面对数万人的轮候就诊名单。这让我深受触动，并开始思考能否利用人工智能技术辅助皮肤病诊断。

我们随后从互联网收集了大量皮肤病相关图像数据，也取得了一些初步研究成果。但由于网络图片的版权限制，已整理的数据集无法公开共享，相关研究目前仍停留在学术探索层面。

问：当前医学场景对AutoML技术提出了哪些特殊要求？主要的研究难点在哪里？

褚晓文：医学数据敏感且私密，获取大规模、高质量、标注精准的数据集本身就很困难。同时，资深医生的标注成本极高。因此，如何在有限的数据上搜索出泛化能力强的鲁棒模型，是一大核心挑战。

此外，还必须严格防范数据隐私泄露风险，例如模型可能遭受逆向攻击而还原原始数据。因此，如何利用AutoML搜索出既高效又具备隐私保护能力的模型，是未来需要重点关注的方向。

问：AutoML在医学场景的应用，距离真正进入临床辅助决策还有多远？

褚晓文：AutoML是一个快速发展的新兴技术，但其本质仍属于机器学习范畴，只是用自动化搜索算法和大量算力替代了部分人工设计工作。它本身并未从根本上缩短或拉长机器学习技术从实验室走向临床的距离。

AutoML包含数据准备、特征工程、模型搜索、超参调优等多个流程，但目前大多数研究只聚焦于单个流程，如神经架构搜索或数据增强。因为当多个流程联合进行自动化搜索时，搜索空间会呈指数级爆炸，如何在这个巨大的组合空间中高效寻优，仍是严峻挑战。此外，厘清AI医疗器械相关的法律法规与伦理审查问题，也是一个紧迫且复杂的系统性工程。

问：未来是否有计划将AutoML技术拓展到医疗以外的其他领域？

褚晓文：是的，团队已开始将AutoML技术应用于智能驾驶的视觉感知环节。目标是搜索出同时满足高精度、低延迟实时推理要求，并能适应特定车载硬件算力与功耗约束的轻量化模型。

来源:https://www.leiphone.com/category/ai/YvVETdpX0yJ2VvqY.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：周礼栋晋升微软全球资深副总裁复旦大学校友职场成就下一篇：中国机器翻译先驱刘倬逝世 NLP领域的重要贡献者