人工智能在药物研发领域的应用正不断取得新突破——一款名为DrugAgent的多智能体系统,正尝试重新定义研发效率与预测精度的边界。该系统由南加州大学、卡内基梅隆大学和伦斯勒理工学院的研究团队联合打造,专为医药行业中的高复杂度任务而设计。
DrugAgent的核心优势在于,能够将令人头疼的药物发现任务拆解为一个个更小、更可控的子任务。每个智能体都拥有处理特定领域知识的能力,并可自动执行机器学习任务——这相当于将专家的经验与工具调用能力整合到同一个系统中。
在ADMET预测、药物-靶点相互作用预测以及分子优化三个专业测试中,DrugAgent表现十分亮眼。以ADMET预测任务为例,它自动构建了一个随机森林模型,在PAMPA数据集上取得了F1得分为0.920、ROC-AUC得分为0.817的成绩——这一水平已经相当可观,显示出强大的预测性能。
这套多智能体系统的核心包括两个关键组件:LLM Instructor和LLM Planner。前者负责识别哪些步骤需要领域知识,并准备相应的工具;后者则负责管理和优化整个想法空间,确保最终生成的方案既可行又高效。
LLM Instructor的第一步工作是对问题进行分解。比如在ADMET预测任务中,它会将任务拆解为数据获取、分子指纹生成、模型训练和性能评估等子步骤。识别出这些子步骤后,再分析哪些环节需要领域专业知识或特定的工具。这一过程会借助专家策划的提示来提升准确性,从而减少歧义。
在确定需要领域知识的子步骤后,LLM Instructor会收集或创建相应的工具——例如调用特定的API或库来处理生物数据或化学计算。为了确保工具准确可靠,它还会设计单元测试进行验证,从而降低错误传播的风险。通过这种方式,DrugAgent逐渐构建起一个可复用的工具箱,后续任务中可以直接调用,既提升了效率又减少了出错几率。
LLM Planner的角色则是管理一个“想法空间”——即所有可能方法或解决方案的集合。在药物发现这类缺乏确定性解决方案的任务中,这一管理过程尤为重要。它会根据问题陈述生成多个候选想法,然后利用编程观察(如工具失败或实验结果)来迭代优化这个想法集:剔除不可行的方案,调整现有方案以解决已识别的局限,或者基于累积的知识引入新想法。
研究团队在三个专业测试平台上对DrugAgent进行了综合评估:
在ADMET预测任务中,DrugAgent面临的挑战是预测药物的药代动力学属性——这直接关系到药物的疗效和安全性评估。它自动下载并分割PAMPA数据集,生成分子指纹,训练随机森林模型来预测吸收性。实验结果显示,该随机森林模型在预测吸收性时达到了0.920的F1分数和0.817的ROC-AUC分数,表现十分出色。
在DTI预测任务中,DrugAgent需要预测药物与目标蛋白之间的结合亲和力。这项任务对药物再利用和副作用预测具有重要意义。通过分析小分子化合物结构以及蛋白质氨基酸序列,DrugAgent成功实现了这一多实例预测任务的全程自动化,展现了其在药物研发中的实用价值。
在分子优化任务中,DrugAgent的目标是生成具有理想药物属性的新分子。这是一项生成任务,要求它不仅理解已有分子结构,还能创造全新的结构。DrugAgent采用目标设计方法,减少了全面搜索的需要,在效率和创新性上均有不俗表现,进一步证明了其在药物发现领域的应用潜力。
