最近谷歌推出了一项重大举措——8月19日,他们正式通过Google Cloud API向研究人员开放了名为健康声学表征(HeAR)AI模型。这一模型专为分析人体声音信号(如咳嗽、呼吸)而设计,能够辅助医生进行疾病的筛查、诊断与监测。

早在今年3月,就有报道提及这款模型——它可通过分析咳嗽和呼吸来辅助疾病诊断。如今,谷歌正式开放其API,意味着更多研究机构能够基于该基础模型开发自己的应用。
在性能方面,HeAR在各项任务中的表现均优于同类模型。关键在于,它在捕捉健康相关声学数据中的有意义模式方面展现了卓越能力。更值得关注的是,基于HeAR训练的模型仅需较少的数据量即可获得良好性能。在医疗保健研究领域,数据稀缺往往是最大瓶颈之一,因此这一优势堪称核心。
谷歌研究团队是如何训练该模型的?他们从一个多样化、去标识化的数据集中收集了3亿条音频数据,其中针对咳嗽模型,专门使用了约1亿条咳嗽声进行训练。可谓“听尽天下咳嗽声”。
HeAR的潜在应用范围相当广泛。例如,印度呼吸保健公司Salcit Technologies正尝试将HeAR集成到其现有AI模型Swaasa中,旨在通过咳嗽声实现肺结核的早期检测。在医疗资源相对匮乏的地区,这类技术的影响力不容小觑。
然而,HeAR的潜力远不止肺结核。该模型能够在多种麦克风和不同环境条件下通用,这意味着它可以为多种呼吸系统疾病提供低成本、无障碍的筛查方案。从某种意义上说,这标志着声学健康研究向前迈出了实质性的一步。谷歌的目标是让这项技术广泛普及,支持全球医疗界开发出更多创新解决方案,从而打破早期诊断和护理的障碍。
