游乐游手机版
首页/AI热点日报/热点详情

NVIDIA联合阿斯利康与佛罗里达大学健康学院实现AI药物探索突破

类型:热点整理2026-07-04
NVIDIA Clara Discovery 的定位十分清晰:为药物研发领域的研究人员提供一套真正实用且高效的工具,加速新型药物的发现进程。 此次,NVIDIA 联合生物制药巨头阿斯利康以及佛罗里达大学的学术健康中心,共同利用 Transformer 神经网络开展 AI 药物研究。这一战略布局意义深

NVIDIA Clara Discovery 的定位十分清晰:为药物研发领域的研究人员提供一套真正实用且高效的工具,加速新型药物的发现进程。

NVIDIA携手阿斯利康和佛罗里达大学健康学院实现AI药物探索突破

此次,NVIDIA 联合生物制药巨头阿斯利康以及佛罗里达大学的学术健康中心,共同利用 Transformer 神经网络开展 AI 药物研究。这一战略布局意义深远。

Transformer 架构近年来在自然语言处理领域表现卓越,如今终于进入药物发现赛道。其最大优势在于:研究人员可以直接使用批量数据进行预训练,无需手动标注数据。模型像学习语言语法一样,掌握化学领域的句法规则,并能够跨研究领域和模式进行迁移应用。

以下是几个重点合作项目的详细介绍。

NVIDIA 与阿斯利康正携手开发一个基于 Transformer 的生成式 AI 模型,专门用于药物研发中的化学结构生成。该项目将成为 Cambridge-1 超级计算机上运行的首个任务——Cambridge-1 是当前英国性能最强的超算。最重要的是,该模型将开源并发布到 NGC 软件目录中,供全球研究人员使用,还能直接部署在 NVIDIA Clara Discovery 平台上。

与此同时,佛罗里达大学健康学院也取得了突破性进展。他们利用 NVIDIA 最新的 Megatron 框架以及 NGC 上的 BioMegatron 预训练模型,构建了 GatorTron——迄今为止规模最大的临床语言模型。

NGC 上还新增了 AtacWorks,一个用于识别可访问 DNA 区域的深度学习模型;以及 MELD,一个能够从稀疏、模糊甚至含噪声的数据中推断生物分子结构的工具。

用于分子分析的 Megatron 模型

NVIDIA 与阿斯利康联合开发的 MegaMolBART 模型,计划用于反应预测、分子优化和分子生成。它基于阿斯利康自研的 MolBART Transformer 模型,在 ZINC 化合物数据库上训练,然后借助 NVIDIA 的 Megatron 框架在超级计算机上进行大规模扩展。

ZINC 数据库规模庞大,研究人员可以在不手动标记数据的情况下预训练模型,使其理解化学结构。模型学会了化学的“统计分布”,进而能够执行多种下游任务——例如预测化学物质之间的相互作用,或直接生成全新的分子结构。

阿斯利康分子 AI、发现科学和研发部门主管 Ola Engkvist 表示:“就像 AI 语言模型能学习句子中词语之间的关系一样,我们希望用分子结构数据训练的神经网络也能学到真实分子中原子之间的关系。开发完成后,这个 NLP 模型将开源,为科学界提供加速药物研发的利器。”

训练过程在 NVIDIA DGX SuperPOD 上完成。这样一来,研究人员能够发现数据库中不存在但可能是潜在候选药物的分子。这种称为 in-silico 的计算方法,使得药物开发人员在进行昂贵且耗时的实验之前,能够在广阔的化学空间中搜索得更深、更广,同时优化药理特性。

此次合作将使用 NVIDIA DGX A100 驱动的 Cambridge-1 和 Selene 超算来运行大规模工作负载。Cambridge-1 是英国最强的超级计算机,在 Green500 中排名第三,TOP500 中排名第29;Selene 则在最新的 Green500 中排名第一,TOP500 中排名第五。

语言模型加速医疗创新

佛罗里达大学健康学院的 GatorTron 模型是一项重大突破。它在超过 200 万名患者的 5000 万次互动记录上训练,具备多种能力:例如寻找适合参与临床试验的患者、预测并向医疗团队预警危急状况,以及为医生提供临床决策支持。

佛罗里达大学教务长 Joseph Glover 直言:“GatorTron 使用了十多年的电子病历数据来开发最先进的模型。我们最近还利用 NVIDIA DGX SuperPOD 升级了超算设施。这种规模的工具,能让医疗健康研究人员从临床笔记中挖掘出以前无法获取的医疗趋势。”

除了临床医学,该模型还能快速创建患者群组用于临床试验,或研究特定药物、治疗方法及疫苗的效果——这些都能加速药物研发进程。

GatorTron 基于 BioMegatron 构建。BioMegatron 是有史以来训练规模最大的生物医学 Transformer 模型,由 NVIDIA 应用深度学习研究团队使用 PubMed 语料库数据开发,现已发布在 NGC 的 Clara NLP 上——Clara NLP 是一套用生物医学和临床文本预训练的模型集合。

佛罗里达大学健康事务部副主席 David R. Nelson 博士认为:“GatorTron 项目是学术界和产业界专家利用前沿 AI 和顶级计算资源协作的典范。与 NVIDIA 的合作,对佛罗里达大学成为 AI 专业知识和开发中心至关重要。”

为药物研发平台赋能

Clara Discovery 计算药物研发平台还搭载了 NVIDIA Clara Discovery 库和 NVIDIA DGX 系统,进一步推动药物研究。

· Schrödinger 是化学模拟软件开发的领先企业,与 NVIDIA 建立了战略合作伙伴关系。合作内容包括科学计算和机器学习研究、在 NVIDIA 平台上优化 Schrödinger 应用,以及基于 NVIDIA DGX SuperPOD 的联合解决方案——可在几分钟内评估数十亿种潜在药物化合物。

· 生物技术公司 Recursion 安装了 BioHive-1,这是一台基于 NVIDIA DGX SuperPOD 参考架构的超算。截至今年1月,它在 TOP500 榜单中排名第58位。借助 BioHive-1,Recursion 一天就能完成深度学习项目,而使用之前的集群则需要一周时间。

· Insilico Medicine 是 NVIDIA Inception 初创加速计划的成员。他们近期发现了一个治疗特发性肺纤维化的新临床前候选药物——这是第一个针对新疾病靶标、利用 AI 进行分子设计并进入临床试验的案例。由 NVIDIA Tensor Core GPU 驱动的系统生成的化合物,从目标假设到临床前候选化合物选择,仅用时不到18个月,花费不到200万美元。

· Vyasa Analytics 同样是 NVIDIA Inception 的成员。他们利用 Clara NLP 和 NVIDIA DGX 系统,使用户能够获取用于生物医学研究的预训练模型。其 GPU 加速平台 Vyasa Layar Data Fabric,为多机构癌症研究、临床试验分析和生物医学数据协调提供了底层支持。

来源:https://m.elecfans.com/article/1574918.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。