当数据科学真正嵌入到一家顶级医疗机构的骨髓里,会发生什么?答案是:从诊断到治疗,整个链条都可能被重构。美国排名第一的癌症医院——德克萨斯大学安德森癌症中心正在做这件事,而且做得相当彻底。他们的思路很清晰:AI和数据研究不能只是挂在机构边缘的“外设”,必须成为战略核心的一部分。为此,中心专门建立了数据治理体系,数十位研究者同步推进多个AI肿瘤学项目,目标只有一个——改善病人的实际护理体验。

首席数据官Caroline Chung博士这样解释他们的底层逻辑:“我们关注的是上下文中的数据,确保有一条协调好的元数据供应链,来解决目前AI模型从实验室到临床的转化难题。想要建立更强大、更可靠的预测模型,就必须有一套覆盖从数据生成到机器学习临床应用的完整战略。”这种治理思路直接影响医院采集和使用数据的方式,也让数据真正做到了可查找、可访问、可互操作、可重复使用。
说起来,这实际上是一次文化上的深层变革。Chung博士坦言:“我们能捕捉的带上下文信息的数据越多,能提出的问题就越复杂,也更有可能用机器学习的洞察力帮助临床医生改进与患者的互动,指导以数据为依据的治疗决策,最终实现最佳的患者护理结果。”通过搭建一条从高质量数据采集、安全存储到追踪使用情况的流水线,安德森癌症中心为各个项目提供了更扎实的基础——无论是分析放射学数据、制定癌症治疗方案,还是预测败血症等并发症。
目前,中心已有多个项目在NVIDIA DGX系统等新GPU驱动技术的推动下加速推进。新投资让研究者能够调用数千个GPU核心,为整个机构的AI项目提供算力支撑。
将AI应用于诊断影像
肿瘤学的第一步永远是检测,而且越早越好。安德森癌症中心正在开发的早期检测AI应用,目标直指胰腺癌——这类患者的五年生存率仅有10%。为什么选这个病种?因为胰腺癌往往在被确诊时已经发生转移,扩散到了其他器官。
胃肠道放射肿瘤学联合主任Eugene Koay博士介绍:“我们正在研究一种AI模型,它能随时分析我们在CT扫描、核磁共振成像以及内窥镜超声波中看到的胰腺,不管患者本次预约是否跟胰腺有关。”胰腺肿瘤的特性差异很大:有的生长缓慢,有的进展迅猛;有的起源于囊肿,有的则不是。在与早期检测研究网络的合作中,Koay团队正在探索如何用卷积神经网络来判断哪些病例最可能发展成恶性肿瘤,从而让临床医生能提前介入高风险患者。
影像学洞察为治疗方案提供依据
准备用放射疗法治疗癌细胞时,肿瘤学家需要完成一个叫“轮廓勾画”的流程,用来锁定被放射线照射的肿瘤区域。这个过程相当耗时,肿瘤学家手上经常积压着一大批等待制定放疗计划的患者。安德森癌症中心放射物理学副教授Laurence Court博士希望用AI工具来减轻轮廓勾画的人力负担,让医院每年能多治疗几千名癌症患者。他特别关注这类工具在低资源环境中的潜力——那些放射科医生和肿瘤科医生严重短缺的地区,患者往往更难获得挽救生命的放疗。
轮廓勾画也被用于规划核磁共振辅助放射手术,这是一种先进的近距离放射治疗方法,通过植入的放射性种粒将辐射剂量精准传递给癌组织。放射肿瘤学家Steven Frank博士用它来治疗前列腺癌。在核磁共振影像上精确勾画出前列腺及其周围器官的轮廓,能确保放射性种粒被送到正确的位置,既治疗癌症又不伤及邻近组织。
医学影像物理学研究员Jeremiah Sanders博士正在Frank实验室开发转化型AI。他表示,借助采用先进GPU技术的AI模型,中心的肿瘤学家已经提高了近距离放射治疗计划制定和质量评估过程中的轮廓勾画质量。为了进一步评估辐射输送效果,Sanders和Frank还在研究一个模型,用于在近距离放射治疗手术后分析前列腺核磁共振成像,提供关键洞察来帮助医生判断是否需要额外治疗,以及如何做好术后管理。
注意AI模型的准确性
要让AI模型在临床环境中真正站住脚,医学研究者必须能识别出神经网络难以处理的情况,并针对这些“盲区”重新训练模型,从而提升整体性能。影像物理学和放射物理学教授Kristy Brock博士正在开展一个异常检测项目,专门找出AI模型无法通过CT扫描准确勾画肝脏肿瘤的场景——比如患者肝脏内有支架,或者器官周围有积液这类异常图像。
通过识别这些罕见失败案例,研究者可以往训练数据里加入更多与之前罕见情况类似的样本。这种“精准加料”式的连续训练方法,能选择性强化训练数据,比简单堆叠更多同类扫描数据要高效得多。Brock博士打了一个形象的比方:“我们不想继续采集跟前150次扫描一模一样的数据,而是希望找到那些能增加样本数据集多样性的案例,这样才能真正提升模型的准确性和泛化能力。”
