AI虚拟细胞面世:无需实验,精准预测药物疗效机制
有了 AI,科学研究是否有一天可以摆脱对湿实验的高度依赖,通过在计算机中构建“虚拟细胞”,来模拟和理解新药可能产生的生物效应?如今,这一愿景正被逐步实现。由上海交通大学郑双佳教授及其研究团队打造的 VCWorld,构建了如同“生物世界模拟器”的虚拟细胞模型,为新药效果预测开辟了全新的计算路径。

图 | 郑双佳(来源:郑双佳)
他告诉 DeepTech:“其核心技术在于,我们基于 AI 科学家系统,发展了一种大语言模型与知识图谱混合增强的预测方式。我们构建了一个知识图谱,将人类已知的知识,如药物与靶点的关系、靶点与疾病的关系等,以显式、结构化的方式建模起来。”

(来源:https://arxiv.org/abs/2512.00306)
VCWorld:像侦探一样推理的白盒模型
VCWorld 的突破在于,它不是一个只会猜测的黑盒子,而是一个能像生物学家一样推理的白盒模型。它把 AI 变成了一个细胞侦探,既可以给出答案,还可以给你查看它的破案笔记。
VCWorld 的核心思想非常巧妙:
首先是构建一个生物知识宇宙,整合多个权威的生物数据库,把药物、基因、蛋白质、信号通路之间的关系,像地图一样连接起来,形成一个巨大的生物知识图谱;
其次,使用语言模型来理解知识,让一个大语言模型来读懂生物知识图谱中的复杂关系,并使用人类可以理解的语言描述出来;
最后,像侦探一样检索和推理,当被问到药物 A 对于基因 B 有什么影响的时候,VCWorld 不是去直接猜测,而是在知识图谱里查找药物 A 的作用机制和基因 B 的功能,以及去历史档案也就是训练数据里寻找最相似的案例比如作用机制相似的药物 C 是如何影响基因B的,然后像撰写推理报告一样,一步一步分析这些线索,综合得出一个结论并解释为什么。
在论文里,郑双佳等人举了一个例子:预测抗癌药物 Larotrectinib 对于增殖标记基因 MKI67 的影响。MKI67 基因产生的蛋白叫做 Ki-67,是细胞正在活跃分裂的指示灯。如果一种药物能够抑制癌细胞分裂,那么 Ki-67 的水平通常会下降。

(来源:https://arxiv.org/abs/2512.00306)
虽然之前没有直接实验证明 Larotrectinib 会影响 MKI67,但 VCWorld 是的推理是这样的:
第一步,寻找相似药物,借此发现 Larotrectinib 是一种激酶抑制剂。在历史案例中,作用机制相似的药物 Afatinib(另一种激酶抑制剂)被证明能够降低 MKI67 的表达;
第二步,寻找共同模式,其他一些能够引起 DNA 损伤或者细胞应激的药物,也会改变 MKI67 的水平。这说明,凡是干扰细胞生长和分裂过程的扰动,都有可能影响这个指示灯;
第三步,得出结论也就是 Larotrectinib 很可能通过抑制肿瘤细胞的增殖信号通路导致 MKI67 的表达出现下降。
这个预测与后来查到的真实实验结果完全一致。此前有文献记载称,使用 Larotrectinib 治疗之后,Ki-67 阳性的增殖细胞确实显著减少了,这证明 VCWorld 的推理不仅准确,而且有着坚实的生物学逻辑。
郑双佳表示:“我们的整个预测过程逻辑链路非常明确。模型能够解释为什么我认为这个药物会在这个细胞系上引起这个基因的差异化表达,并提供一套可追溯的知识推理链条。这就将传统的、黑箱式的虚拟细胞预测,变成了一个白箱式的、引入了因果推理引擎的过程。”

(来源:https://arxiv.org/abs/2512.00306)
什么是虚拟细胞?
细胞是我们身体里最小的生命单位,就像一个超级迷你的工厂,里面有无数的机器也就是蛋白质在不停地工作。科学家们一直想弄明白的是:如果给细胞喂一种新药,会有什么反应?哪些基因会被激活?哪些会被抑制?这对于治疗疾病和研发新药至关重要。
传统方法是在实验室里培养真实的细胞,加入药物之后再使用昂贵的仪器来检测变化。这个过程不仅耗时和耗钱,而且每次只能测试有限的药物。于是,虚拟细胞的概念诞生了:能不能在电脑里建设一个细胞的数字模型,让 AI 来预测药物的效果?
其实,已经有不少 AI 模型尝试过这个任务。但是这些模型非常挑食,它们需要海量的高质量数据来训练,如果遇到一种全新的、训练数据里没有出现的药物,就有可能预测不准。而且,这些模型依旧存在黑盒问题。而 VCWorld 则解决了这些问题。
郑双佳表示:“虚拟细胞这个概念其实已有二三十年的历史。近年再次兴起,有几个重要原因:单细胞多组学测序技术在前几年取得了重大突破,无论是蛋白质组学还是其他组学,高通量检测设备的水平提高、成本下降、精度提升,使得多组学数据大量积累。有了海量数据,人们自然会想到能否用这些数据构建类似 ChatGPT 的模型,去理解细胞尺度的语言,而不仅仅是 DNA、RNA 序列层面的语言。”
他继续说道,目前的虚拟细胞模型更像一个疾病解码器或基于表型的建模工具。但基于表型建模的最大问题是难以逆向设计药物:假设知道药物A会产生某种扰动信号,但很难根据想要的信号反向设计出分子 A。这是基于表型的药物发现的一个固有弊端。
因此,他和团队正在尝试向药物设计方向进行反向推理。例如,基于某种特定的、非药物手段(如敲低某个基因)或疾病状态产生的扰动信号,基于所期望逆转的细胞状态,能否根据这个期望的响应,反向设计出一个能实现该扰动的分子?“这是我们正在努力探索的方向。”他表示。
参考资料:
相关论文
https://arxiv.org/abs/2512.00306
排版:KIK
相关攻略
中国航天员科研训练中心招募卧床实验志愿者,需卧床最长60天以模拟失重环境,研究生理变化。参与者需符合健康及心理标准,实验过程伴随不适但受严密监控。数据对航天医学与老年病学有重要价值,志愿者可获得补助及交通报销。
“我能再说几句吗?” 在复旦大学相辉堂举行的“浦江科学大师讲坛”互动环节结束后,2024年诺贝尔物理学奖得主安妮·吕利耶教授主动提出了这个请求。她分享了一个温暖的观察:“我曾受邀在各种场合做过演讲,很多时候提问的都是男性,但这次几乎都是女性在提问题,请大家坚持下去。”作为第五位获得诺贝尔物理学奖的女
你还在一个人做科研吗? 科研路上最磨人的,往往不是问题本身,而是那种彻头彻尾的“孤军奋战”感。一个想法,从文献调研到实验设计,再到落笔成文,每一步都只能靠自己摸索着前行。 方向偏了,没人及时提醒;遇到歧义,找不到人讨论;结果不对,就只能陷入反复试错的循环。市面上不少所谓的“自动化科研”工具,其实只是
Claw AI Lab团队量子位 | 公众号 QbitAI你还在一个人做科研吗?科研最难的,从来不是问题本身,而是一个想法从文献到实验再到写作,只能靠自己一点点往前推。一个人方向偏了没人提醒,遇到歧
上海交大义理林团队,以AI赋能激光器,用于芯片测量切割,致力于实现高端制造的自主可控;上海交大李金金团队,将深耕设备一辈子的老师傅们口传心授的实操经验,炼成工业时序控制大模型;上海交大谢伟迪团队研发
热门专题
热门推荐
机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。 正如其“一个大脑,无限可能”的口号所揭示
xAI正式进军AI编程智能体领域,于近日发布了专为软件工程与复杂编程任务设计的Grok Build。 简单来说,Grok Build是一款能在终端里直接跑起来的AI编程助手。它被定位为一个具备智能体能力的命令行工具,开发者用自然语言告诉它要做什么,它就能生成代码,甚至帮你搞定一系列编程和自动化任务。
近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企
硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到
这项由高通AI研究院(Qualcomm AI Research)主导的创新研究于2026年5月正式发布,论文预印本编号为arXiv:2605 07721。 研究背景:当AI越想越费内存,我们该怎么办 设想一下,手机导航应用会在出发前规划好整条路线,而一位真正智慧的向导则会边走边思考,遇到路障时灵活应





