先说几个核心判断:针对固有无序蛋白(IDP)的靶向药物设计,业界长久以来面临一个心照不宣的难题——这些蛋白如同“液体”般缺乏固定构象,传统依赖单一晶体结构的筛选方法几乎失效。不过,近期浙江大学侯廷军教授、李丹教授团队在 Nature Communications 上发表的研究,为破解这一困局带来了新的希望。该工作的共同第一作者为祝凯、王华婷博士研究生以及张锦途博士后。
他们聚焦于前列腺癌治疗中的一个棘手靶点——雄激素受体(AR)的N端结构域(AR-NTD)。不同于传统的配体结合结构域(AR-LBD),AR-NTD是一段典型的“无序”区域,而它恰恰是耐药性癌细胞依然依赖的“致命要害”。这项研究的核心在于,开发了一套融合机器学习与增强采样的计算流程,成功绘制了AR-NTD的构象图谱,并从中发现了一种新型拮抗剂K53。
研究背景:为何执着于攻克“无序”靶点?
固有无序蛋白(IDPs)在癌症、神经退行性疾病中的作用日益受到关注,但其高度动态、构象多变的特点,让传统基于“锁钥模型”的药物设计束手无策。在前列腺癌领域,现有药物如比卡鲁胺、恩扎卢胺均靶向AR-LBD。然而癌细胞极为狡猾,一旦LBD发生突变、扩增甚至被剪接体直接切除,这些药物便会失效。而AR-NTD在多种耐药机制中始终“屹立不倒”,持续承担关键的转录激活功能。
真正的挑战在于,AR-NTD本身缺乏稳定结构,其“口袋”是瞬态且转瞬即逝的。尽管此前有EPI-001、EPI-002等分子被报道可作用于AR-NTD,但它们究竟如何结合、非共价识别如何导向最终的共价稳定,这些问题始终未获清晰解答。正是这一痛点,推动该团队搭建了一套全新的计算范式。
方法概述:一套“三步走”的机器学习增强采样工作流
面对IDP这类“流动靶点”,常规集合变量(CV)难以描述,传统采样方法也容易陷入局部极小值。研究团队的做法可分解为三个递进的技术环节。
REST3 结合AE CV,锁定Tau-5的九个“面孔”
研究团队首先聚焦于与EPI-002结合密切相关的Tau-5片段。他们采用REST3增强采样法,使这段高度柔性区域充分“运动”。但仅采样还不够,还需解读数据。于是,他们利用自编码器(AE)这一机器学习方法,从海量动态轨迹中进行降维,构建出低维自由能面。结果十分有趣:Tau-5竟呈现出九个结构差异明显的亚稳态构象。这好比为一位动态演员抓拍到九张标志性“定妆照”,为后续研究奠定了坚实基础。
SWISH 引出“隐藏”口袋,并解析EPI-002的结合模式
明确了构象,下一步是寻找“口袋”。研究团队借助SWISH模拟,向这九个构象中“投掷”疏水探针,诱导原本隐藏在蛋白表面的疏水瞬态口袋暴露出来。这如同往水里丢肥皂,将油污(隐藏口袋)硬生生“挤”出。随后,他们将EPI-002对接至这些口袋中。结果显示,EPI-002的氯原子总是邻近第404位半胱氨酸(Cys404)的硫原子,暗示了形成共价键的潜力。同时,配体周围环绕着大量芳香残基,表明π-π堆积与疏水作用共同参与了最初的“握手”过程。
OPES、MLCV与Deep-TICA,奏响配体识别的“交响乐”
静态结合模式虽已呈现,但完整的结合/解离过程是怎样的?尤其是水分子在其中扮演什么角色?为此,团队引入OPES增强采样,并创新性地构建了包含水分子信息的机器学习集合变量。通过多任务学习,模型能同时描述结合态、非结合态以及水介导的中间态。最后,利用Deep-TICA从增强采样轨迹中提取慢动力学模式,成功解析了EPI-002结合、解离以及那个关键的水介导中间态的动态演变过程。

图1. 解析IDP可成药构象与小分子作用机制的机器学习增强采样工作流。
结果与讨论
这套工作流究竟是否可靠?研究团队从构象采样、结合机制,一直验证到虚拟筛选和湿实验,构建了一套完整的“证据链”。
验证:模拟的“九张脸”与实验数据吻合
首先用NMR化学位移实验数据进行校准。结果显示,REST3模拟得到的二级结构和Cα化学位移与实验结果高度一致。这表明REST3并未“跑偏”,能够真实反映Tau-5的动态行为。而以此为基础识别出的九个亚稳态构象,也就有了坚实的采样依据。

图 2. REST3增强采样刻画Tau-5的动态构象分布并验证模拟可靠性。

图 3. AE CV自由能面揭示Tau-5的九个亚稳态构象。
口袋识别:SWISH让“隐藏”变为“可见”
单纯观察静态结构,很难在Tau-5上发现药理学“抓手”。SWISH模拟的价值正在于此,它成功地在多个亚稳态构象中诱导出结合口袋,并指导了EPI-002的对接。对接结果反复验证了Cys404是共价结合的“锚点”,而周围芳香残基则构成了非共价识别的基础。

图 4. SWISH模拟诱导Tau-5隐蔽结合口袋打开并支持EPI-002结合。
机制解析:水分子不是“旁观者”,而是“参与者”
Deep-TICA的分析非常精彩。它揭示了EPI-002的结合与解离并非简单的“开”与“关”。在结合口袋中,结构水分子会形成桥联的氢键网络,这些水分子在配体解离过程中还能稳定中间态。换句话说,水分子主动参与并调控了整个识别过程,这是一个至关重要的动态细节。

图 5. Deep-TICA揭示EPI-002结合/解离过程中的结构水介导氢键网络。
新药发现:从计算到实验,K53脱颖而出
有了可靠的构象和口袋信息,研究团队顺理成章地开展了基于结构的虚拟筛选。最终发现一个名为K53的分子。实验数据十分亮眼:K53在前列腺癌细胞系中,尤其是对恩扎卢胺耐药的22Rv1和LNCaP-EnzR细胞,展现出显著的抗增殖活性,且对非肿瘤细胞毒性较低。SPR、NMR、WaterLOGSY、CETSA等一系列实验证实K53确实靶向AR-NTD-AF1区域。功能实验表明,它能有效抑制AR转录活性,下调KLK3、FKBP5等经典靶基因。结构建模显示,K53在关键药效团上与EPI-002具有相似的空间分布,但经过改造获得了更优的活性。

图 6. 虚拟筛选与多维实验验证发现新型AR-NTD拮抗剂K53。
可迁移性验证:c-Myc体系同样适用
这套方法是否只对AR-NTD有效?为证明其通用性,研究团队将其应用于另一个著名的固有无序蛋白c-Myc上。结果同样令人满意:流程成功识别了c-Myc的亚稳态构象和结合口袋,并且计算得到的抑制剂10058-F4结合自由能与实验测得的微摩尔级亲和力一致。

图 7. c-Myc固有无序体系验证工作流通用性。
总结
综观这项研究,其最大贡献在于构建了一个从构象采样、口袋识别、机制解析到先导发现的计算-实验闭环。它系统性地回答了AR-NTD这个“无序”靶点到底有多少种“面孔”、药物如何识别它、以及我们如何据此发现新药。最终获得的K53,不仅为难治性前列腺癌提供了一个有潜力的候选分子,更重要的是,这套机器学习增强采样工作流为整个固有无序蛋白(IDP)药物开发领域点亮了一盏新的导航灯。
参考资料
Zhu, K., Wang, H., Zhang, J. et al. Targeting the intrinsically disordered AR-NTD through a machine learning-based enhanced sampling workflow. Nat Commun (2026).
https://doi.org/10.1038/s41467-026-73863-x
