首页 游戏 软件 资讯 排行榜 专题
首页
AI
港科大褚晓文团队医疗AutoML模型参数量更小分类准确率更高

港科大褚晓文团队医疗AutoML模型参数量更小分类准确率更高

热心网友
78
转载
2026-05-15

人工智能技术正深刻变革各行各业,其中,医疗健康领域因其对精准与效率的极致追求,成为AI技术落地最具潜力的前沿阵地。如何让智能算法更精准、更高效地赋能临床诊疗,是当前研究与实践的核心课题。

近年来,自动机器学习(AutoML)技术备受关注。它旨在自动化模型设计与参数调优过程,将研究人员从繁复的工程任务中解放出来,已在工业、农业等多个领域证明了其价值。那么,当这项追求效率的技术,遇上对准确性与可靠性要求极高的医学诊断,将产生怎样的化学反应?

香港科技大学(广州)数据科学与分析学域正教授褚晓文及其团队,是这一交叉领域的积极探索者。他们的研究表明,通过驾驭强大的计算能力处理复杂的医疗场景数据,AutoML能够有效辅助医生,减轻其工作负担,推动计算机辅助诊断向更智能、更精准的方向发展,最终提升整体诊疗效率并优化医疗资源配置。

AutoML + 医学:从辅助诊断到效率革命

从疾病辅助诊断、慢性病风险预测到智慧健康管理,人工智能正引领传统医疗研究进入新纪元。其中,“AI+医学影像”作为关键技术分支,其可诊断的病种范围、分析速度与识别准确率均在持续突破。

图注:褚晓文教授

褚晓文教授于1999年获得清华大学计算机科学与技术系学士学位,2003年于香港科技大学计算机科学系获博士学位。2003年至2021年,他在香港浸会大学计算机科学系历任助理教授、副教授、正教授,现任香港科技大学(广州)数据科学与分析学域正教授。他的研究方向涵盖GPU计算、分布式机器学习、云计算与无线网络等,在国际知名期刊与会议上发表论文200余篇,谷歌学术H指数为46,总引用超7900次,并多次荣获IEEE INFOCOM等顶级会议的最佳论文奖。

自2018年起,褚晓文团队便开始探索AutoML在医疗场景的应用。2019年末,新冠疫情全球爆发,给医疗诊断系统带来了空前压力。当时,核酸检测耗时且依赖特定试剂,而基于医学影像的人工诊断则高度依赖医生经验,分析流程长且难以识别早期隐匿病变。

面对这一紧迫需求,团队开始思考:能否利用AutoML技术来提升COVID-19的影像诊断效率?随着公开的胸部X光与CT影像数据集陆续发布,褚晓文与博士研究生贺鑫以此为基础,构建了基于深度学习的COVID-19检测与诊断模型,并对主流数据集与评估指标进行了系统性梳理。

在相关综述论文中,团队从模型任务与影像数据类型两个维度,系统梳理了现有的COVID-19检测诊断模型,并从骨干网络、数据集、影像模态等六个方面进行了深入的对比分析。

然而,一个现实挑战在于:各种人工设计的深度学习模型在不同数据集上表现不一,缺乏一种通用性强、能自适应不同数据特性的神经网络架构。AutoML的应用,正是为了针对特定数据集自动搜索出最优的网络模型,从而大幅降低人工试错与调参的成本。

为了改进基于权重共享的神经架构搜索策略的稳定性,团队提出了一种高效的进化多目标结构搜索框架。同时,针对医疗数据常面临的小样本难题,他们创新性地提出了一个集成自动数据增强与自动网络搜索的一体化新框架。该框架在多个公开COVID-19数据集上均取得了领先的性能表现。

对话褚晓文:深入AutoML的医疗实践

为了更深入地了解AutoML在医疗领域的应用价值与面临挑战,我们与褚晓文教授进行了一次专访。

问:在COVID-19辅助诊断研究中,你们使用的是开源工具还是自研平台?目前预测效果如何,在哪种任务上表现更优?

褚晓文:我们基于微软亚洲研究院开发的NNI早期版本,搭建了自己的分布式AutoML框架,并重构了基础模块以提升代码复用性。后续的研究工作都基于此自研框架展开。

目前,我们主要在CT影像分类任务上进行了充分验证。实验结果表明,通过AutoML搜索得到的模型,不仅参数量更小,其分类准确率也优于许多广泛使用的人工设计卷积神经网络。此前,英伟达团队利用AutoML在医疗影像分割任务上也取得了显著成效。

问:COVID-19传播快,意味着图像数据集需要不断更新扩充。团队如何应对数据的动态增长,并提升模型的泛化能力?

褚晓文:AutoML可以看作是超参数优化、神经架构搜索和数据增强等技术的集成工具箱。我们当前的研究重点集中在神经架构搜索上,即针对给定任务自动寻找最优的模型结构与超参数组合。

医疗数据涉及患者隐私,初期往往规模有限且存在类别不均衡问题。实际上,COVID-19数据集规模的扩大,反而有助于我们搜索到性能更优的模型。我们正在尝试将数据增强技术与神经架构搜索更紧密地结合,以期进一步提升模型的泛化性能。

问:面对医疗数据中常见的噪声和不一致性问题,如何保证算法的准确性与运行效率?

褚晓文:我们前期工作基于3D CT数据集,其噪声表现为切片不含肺部区域、序列顺序错误或存在重复切片等。目前,这类问题主要依赖人工方式进行清洗和修正。自动化数据清理本身是一个重要的研究课题,但我们团队尚未在此方向深入展开。

对于数据不均衡问题,我们采用数据增强和调整类别采样频率的方法来缓解。而数据不一致性带来的核心启示是:数据集本身的质量对最终识别精度的影响,有时甚至超过模型架构的选择。很难设计出一个“万能”的人工模型来完美适配所有数据集。因此,利用AutoML为特定来源的数据集(如来自同一医院、同一型号设备)定制专属模型,是一个极具前景的方向。

问:系统部署的实际难度如何?面对大规模诊断需求,您此前在分布式机器学习(如联邦学习)上的研究是否带来了新的思路?

褚晓文:由于尚未与医疗机构开展实际临床合作,我们的模型还未在真实医院场景中进行部署测试。但在公开数据集的实验中,AutoML确实能够搜索到更轻量化、同时准确率更高的模型。

我们也研究过联邦学习在COVID-19诊断中的应用。模拟实验发现,数据质量较差的参与方(“数据孤岛”)能从联邦学习中获益,但数据质量高的参与方性能提升有限,有时甚至可能因聚合而性能下降。这是一个非常有趣的现象,值得未来深入探究其背后的机理。

问:您当前的主要研究方向是什么?有哪些突出的研究成果?

褚晓文:我目前主要聚焦于高性能机器学习系统。得益于在GPU与分布式计算领域的长期积累,我们团队较早关注大规模分布式机器学习,于2016年研发了早期开源深度学习基准测试系统DLBench,获得了学界与工业界的关注。

随后,我们与企业合作研发了一系列原创的分布式训练加速技术,并在2018年使用2048块GPU,在ImageNet数据集上实现了当时全球最快的图像分类模型训练速度。团队还在分布式机器学习通信优化方面提出了多种高效方法,相关成果发表在IEEE INFOCOM等顶级会议与期刊上,并获得了IEEE INFOCOM 2021最佳论文奖。

问:您从何时开始AutoML研究?主要经历了哪几个阶段?

褚晓文:我们从2018年开始系统调研AutoML。其最吸引人的地方就在于“自动化”这一终极愿景,有望将研究者从枯燥的调参工作中解放出来。

我们的研究大致经历了几个阶段:首先,通过调研数百篇文献,完成了一篇AutoML综述,它已成为国际期刊《Knowledge-Based Systems》近三年来引用和下载量最高的论文之一,对普及AutoML知识起到了一定作用。其次,在神经架构搜索研究热潮中,我们在医学图像分类等任务上验证了其有效性。之后,我们开始更深入地探究模型结构对性能的本质影响,并从系统设计角度致力于提升AutoML的搜索效率和可扩展性。

问:医学场景是团队应用AutoML的第一选择吗?最初是针对哪种疾病展开研究的?

褚晓文:团队涉足医学场景始于2018年。当时,香港发生了一起与皮肤病相关的社会事件。我从媒体报道中了解到,香港公立医疗系统仅有30多位皮肤科专科医生,却要面对数万人的轮候就诊名单。这让我深受触动,并开始思考能否利用人工智能技术辅助皮肤病诊断。

我们随后从互联网收集了大量皮肤病相关图像数据,也取得了一些初步研究成果。但由于网络图片的版权限制,已整理的数据集无法公开共享,相关研究目前仍停留在学术探索层面。

问:当前医学场景对AutoML技术提出了哪些特殊要求?主要的研究难点在哪里?

褚晓文:医学数据敏感且私密,获取大规模、高质量、标注精准的数据集本身就很困难。同时,资深医生的标注成本极高。因此,如何在有限的数据上搜索出泛化能力强的鲁棒模型,是一大核心挑战。

此外,还必须严格防范数据隐私泄露风险,例如模型可能遭受逆向攻击而还原原始数据。因此,如何利用AutoML搜索出既高效又具备隐私保护能力的模型,是未来需要重点关注的方向。

问:AutoML在医学场景的应用,距离真正进入临床辅助决策还有多远?

褚晓文:AutoML是一个快速发展的新兴技术,但其本质仍属于机器学习范畴,只是用自动化搜索算法和大量算力替代了部分人工设计工作。它本身并未从根本上缩短或拉长机器学习技术从实验室走向临床的距离。

AutoML包含数据准备、特征工程、模型搜索、超参调优等多个流程,但目前大多数研究只聚焦于单个流程,如神经架构搜索或数据增强。因为当多个流程联合进行自动化搜索时,搜索空间会呈指数级爆炸,如何在这个巨大的组合空间中高效寻优,仍是严峻挑战。此外,厘清AI医疗器械相关的法律法规与伦理审查问题,也是一个紧迫且复杂的系统性工程。

问:未来是否有计划将AutoML技术拓展到医疗以外的其他领域?

褚晓文:是的,团队已开始将AutoML技术应用于智能驾驶的视觉感知环节。目标是搜索出同时满足高精度、低延迟实时推理要求,并能适应特定车载硬件算力与功耗约束的轻量化模型。

来源:https://www.leiphone.com/category/ai/YvVETdpX0yJ2VvqY.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

港科大褚晓文团队医疗AutoML模型参数量更小分类准确率更高
AI
港科大褚晓文团队医疗AutoML模型参数量更小分类准确率更高

人工智能技术正深刻变革各行各业,其中,医疗健康领域因其对精准与效率的极致追求,成为AI技术落地最具潜力的前沿阵地。如何让智能算法更精准、更高效地赋能临床诊疗,是当前研究与实践的核心课题。 近年来,自动机器学习(AutoML)技术备受关注。它旨在自动化模型设计与参数调优过程,将研究人员从繁复的工程任务

热心网友
05.15
Qlik AutoML : 无代码,自动化机器学习
AI
Qlik AutoML : 无代码,自动化机器学习

需求人群 这个工具,说到底是为谁服务的?答案很明确:那些需要构建机器学习模型来做分析、预测和决策规划的团队。无论是市场分析、风险评估,还是运营优化,但凡涉及到从数据中找规律、做预判的活儿,它都能派上用场。它瞄准的,正是希望将数据价值深度挖掘,却又不想在代码和算法细节上耗费过多精力的分析人员。 产品特

热心网友
04.30
2026年五大前沿AutoML技术焦点与核心趋势解析
AI
2026年五大前沿AutoML技术焦点与核心趋势解析

本文探讨了五种前沿的AutoML技术及发展趋势。这些技术有望在即将到来的2026年,塑造高度自动化机器学习模型构建的格局。 译者 | 重明介绍云计算的兴起极大地扩展了机器学习模型在可扩展性和可用性方

热心网友
12.10

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

阿里钉钉文档全功能解析在线协同办公套件使用指南
AI
阿里钉钉文档全功能解析在线协同办公套件使用指南

钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流

热心网友
05.15
商汤小浣熊智能助手基于自研大语言模型
AI
商汤小浣熊智能助手基于自研大语言模型

在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办

热心网友
05.15
MiniMax新一代智能模型矩阵全面解析与应用指南
AI
MiniMax新一代智能模型矩阵全面解析与应用指南

在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M

热心网友
05.15
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景
web3.0
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景

ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。

热心网友
05.15
智能客服机器人解决方案:AI客服系统提升企业服务效率
AI
智能客服机器人解决方案:AI客服系统提升企业服务效率

在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练

热心网友
05.15