来源:人民日报海外版
本报北京电(记者吴月)为疾病靶点精准匹配适配的小分子化合物,是当前靶向药物研发的核心挑战。面对人体内数以万计的潜在靶点,如何快速筛选出苗头化合物?近期,清华大学智能产业研究院教授蓝艳丽联合该校生命学院、化学系团队,创新研发出人工智能驱动的超高通量药物虚拟筛选平台DrugCLIP。该平台的筛选速度较传统方法提升百万倍,其预测准确率也取得显著突破。
依托这一平台,团队首次完成了人类基因组级别的药物虚拟筛选,为创新药物的发现带来了新的可能。相关研究成果以“深度对比学习实现基因组级别药物虚拟筛选”为题,已在线发表于国际学术期刊《科学》。
蓝艳丽介绍,人类基因组编码两万多个蛋白质,受传统工具效率等因素制约,现有蛋白质靶点开发仅覆盖其中一小部分。团队创新性地将传统的分子对接方法,转化为蛋白质口袋与分子在向量空间中的高效语义检索。基于128核中央处理器和8张图形处理器的计算节点,DrugCLIP可在一天内完成十万亿次蛋白质—配体打分,相较传统方法提速百万倍。
速度之外,准确性是否可靠?团队为此进行了一系列实验验证。以去甲肾上腺素转运体为例,它是抑郁症等疾病的重要靶点。DrugCLIP从160万个候选分子中,为该靶点筛选出约100个高评分分子。后续实验检测表明,其中15个为有效抑制剂,更有12个分子的结合能力强于当前一种常用抗抑郁药物。
目前,依托DrugCLIP平台,团队已完成覆盖约一万个蛋白质靶点、两万个蛋白质口袋的虚拟筛选项目,分析筛选了超过五亿个类药小分子,从中富集出超过两百个潜在活性分子,构建了目前已知规模最大的蛋白质—配体筛选数据库。
据悉,该数据库已免费面向全球科研社区开放,为基础研究与早期药物发现提供有力的数据支撑。配套的筛选服务平台也已同步上线,支持用户对上传的靶点和蛋白质口袋进行定制化筛选。截至论文发表时,平台已累计服务1400余名用户,完成了超过1.35万次筛选任务。
蓝艳丽表示,DrugCLIP平台有助于在抗癌、传染病、罕见病等领域,加速新靶点与首创性药物的发现进程。团队将持续优化引擎性能,拓展支持模态,致力于构建更智能、更高效、更普惠的药物创新研发生态。
