AI科学家获诺奖后蛋白质结构预测的机遇与挑战深度解析
2025年1月5日,一场主题为“诺奖之后的新篇章:蛋白质结构预测的机遇与挑战”的线上圆桌沙龙成功举办。本次沙龙由AI科技评论GAIR Live品牌与在CASP评估中表现优异的华人团队联合发起,旨在探讨这一前沿领域在获得诺贝尔奖级认可后的未来走向。
圆桌由江苏理工学院教授常珊主持,并邀请了密苏里大学计算机系教授程建林、山东大学教授杨建益、南开大学统计与数据科学学院教授郑伟、浙江工业大学信息工程学院教授张贵军以及江苏理工学院研究员孔韧等资深学者,共同展开了一场深度对话。

与会嘉宾均是CASP(Critical Assessment of Protein Structure Prediction)竞赛的长期参与者。CASP自1994年起每两年举办一次,被誉为蛋白质结构预测领域的“奥林匹克”。在刚刚结束的第十六届CASP中,华人团队表现亮眼,达到了世界前列水平。讨论中,专家们不仅分享了参赛心得,更聚焦于单序列预测、多构象、RNA结构预测、蛋白质-小分子复合体等前沿挑战,并展望了可能孕育下一个“诺奖级”突破的蓝海方向。
CASP 16的进步与突破
常珊教授首先抛出了话题:本次线下参加CASP16评估会,有哪些令人印象深刻的观察?
程建林教授指出,最直观的感受是参赛团队数量显著增加,尤其是来自中国大陆的科学家们,在各个领域都取得了世界级的成就。杨建益教授则被与会者的专注度所打动:“会议全程四天,几乎无人提前离场,从组织者到报告人都全情投入。CASP能坚持30多年、举办16届,这种长期主义的积累,正是领域取得突破的基石。”
郑伟教授补充了一个重要趋势:亚洲团队(包括日、韩)的参与度正在快速提升,数量已与欧美团队持平甚至有望反超。他同时观察到,CASP近年来越发倾向于解决实际的生物学问题,其赛制设计正在引导整个计算结构生物学的发展方向。另一个有趣的现象是,工业界团队的参赛热情有所下降,“大家可能都去‘卷’大模型了”,留下学术界团队继续坚守核心问题。
张贵军教授虽未亲临现场,但通过会议材料同样感受到,CASP的核心魅力在于它更像一个“实验”而非单纯的“竞赛”,更关注生物学洞见而非简单的排名。首次线下参会的孔韧研究员则对会议的历史回顾环节感慨颇深:“组织者将整个科研生涯奉献给结构预测这一核心问题。生命科学的任何现象,追根溯源都离不开生物大分子的结构。如今,竞赛焦点已从单体结构转向蛋白质与DNA、RNA或小分子形成的复杂体系,甚至开始探索动态结构预测,这对生命科学研究意义重大。”
蛋白质预测新问题的挑战和趋势
话题自然转向技术层面。常珊教授请杨建益和程建林教授分析了本届比赛在蛋白质预测方面的新进步与趋势。
杨建益教授详细介绍了CASP16在蛋白质单体预测上的新赛制——分为phase 0、1、2三个阶段,其中phase 0不提供化学计量信息,挑战性极大。从结果看,进步是增量式的,许多团队结合了AlphaFold2、AlphaFold3及自有方法。AlphaFold3作为基线模型,在功能全面性上优于前代,但精度提升并不显著。一个明显的进步体现在抗体-抗原复合物预测上,有团队通过结合AI与物理采样方法取得了不错结果,不过由于评估数据集较小,其泛化能力尚待观察。
关于“人工干预”的作用,程建林教授认为需分情况讨论。在从多个相似模型中做选择时,人工判断依然困难;但在预测化学计量(phase 0)这类新任务中,借助现有模板信息的人工干预则非常有效。他特别提到,AlphaFold3在比赛中途发布,对许多已基于AlphaFold2构建好流程的团队构成了挑战,如何快速整合新工具成为影响成绩的关键。
展望未来,几位专家指出了几个亟待突破的挑战:
模型排序与质量评估(QA): 当前的主要障碍已从“生成好模型”部分转向“选出好模型”。郑伟教授以抗体预测为例,指出即便采样池中存在接近真实结构的模型,现有QA打分也常无法将其排到前列。CASP16引入了对MassiveFold生成模型的重新排序任务,并更强调模型的自评估,凸显了QA日益增长的重要性。张贵军教授补充道,开发独立于预测方法的单模型QA方法,是未来的重点方向。
化学计量与大规模复合物预测: 预测由几十个甚至更多蛋白质组成的大型复合体结构,仍是AlphaFold系列未能完全解决的难题。同时,化学计量的自动化高精度预测也是一大挑战。
多构象预测: 这是CASP首次设立的独立赛道,反映了领域对动态过程的重视。然而,真实实验数据的严重匮乏制约了发展。郑伟教授认为,生成模型或扩散模型可能是解决多构象预测的有希望路径。程建林教授也指出,没有足够的数据来训练或微调模型,是目前最大的瓶颈。
单序列结构预测: 这被多位专家视为可能产生下一个诺奖的经典问题。当前的AlphaFold等方法严重依赖多序列比对(MSA)输入,但在许多情况下(如孤儿蛋白),我们只能获得单一序列。能否仅从单序列精确预测结构,是揭示蛋白质折叠物理机制的关键,也是巨大的挑战。
RNA结构预测新进展
随着蛋白质结构预测日趋成熟,RNA领域正成为新的焦点。郑伟教授介绍,CASP16极大提升了RNA赛道的权重与难度:相关靶点数量从上届的十多个激增至六十多个,且出现了由十几个RNA形成的超大复合体,体系复杂度陡增。细分赛道也更加丰富,涵盖了RNA单体、复合物及与小分子的相互作用。
“这传递了一个清晰信号,”郑伟教授总结道,“大家的关注点正在向RNA结构预测倾斜。”不过,AlphaFold3在该赛道并未展现出明显优势,其整体排名居中,说明在使用这类工具时,经验与策略同样重要。
杨建益教授补充了更多细节。他认为,就RNA单体预测而言,本届的精度(平均RMSD约15埃)优于上届,主要因为上届包含了极具挑战性的人工设计RNA。他特别指出,与蛋白质预测不同,RNA预测中“人工干预”目前仍至关重要,排名靠前的团队都进行了大量人工修正,如构建二级结构、调整MSA等。这背后根本原因在于数据:蛋白质结构数据库积累了数十万个数据,而RNA的非冗余实验结构仅数百个,AI模型“学得不够好”情有可原。
尽管如此,趋势是明确的。上届领先团队尚未使用AI,而本届前列团队均已借助AlphaFold3或trRosettaRNA等工具进行辅助。“我相信随着数据积累,RNA结构预测的进步速度会加快,下一届应该会有更多团队参与,精度也会更高。”杨建益教授展望道。
小分子预测:AI与传统方法的交汇
在小分子预测方面,本届比赛引入了更接近真实药物研发场景的题目:让算法预测同一蛋白靶点与数十个不同化学结构小分子的结合模式。孔韧研究员指出,AlphaFold3在此展现了其潜力,在部分靶点上的表现超过了所有传统对接方法。“这意味着,在未来药物研发中,将传统对接方法与AlphaFold等深度学习模型结合使用,综合考量多种可能正确的结合姿态,会是一个趋势。”
但这带来了新问题:如何从海量预测结果中筛选出最正确的那个?此外,准确预测小分子与靶蛋白的结合亲和力,对于药物筛选至关重要,但目前这仍是一个处于初级阶段的巨大挑战。程建林教授也提醒,现有AI方法在通用性上存在局限:当测试的小分子与训练数据相似时效果良好,否则性能难以预测。如何提升模型的泛化能力,是亟待解决的问题。
结构预测的蓝海方向
那么,结构预测技术的突破,将对产业界产生何种实际影响?
张贵军教授认为,任何与生物学相关的领域——医学、药学、农学——都与结构密不可分。在药学上,它助力药物靶标发现;随着研究从静态转向多构象,潜在的药物结合位点可能藏于某个动态构象中。在合成生物学领域,对酶结构的深入理解与设计,能够直接推动绿色制造、可降解材料等产业的发展,应对全球性挑战。
孔韧研究员从合作经验出发,描绘了更具体的应用图景:基础医学研究者常通过实验验证蛋白质间的相互作用,而结构预测能提供三维视角,揭示结合界面与关键残基,从而指导更精准的实验设计。若该相互作用与疾病相关,则可进一步衍生出多肽、抗体或小分子药物的研发思路。在合成生物学中,明确限速酶的结构与催化动态过程,便能对其关键残基进行理性设计,改造并提升细胞工厂的效率。
谈及诺奖之后的“下一个突破点”在哪里,两位教授给出了他们的展望。
杨建益教授再次强调了“单序列结构预测”的终极意义,认为这是触及蛋白质折叠物理本质的诺奖级问题。此外,他判断研究的重心必将从静态转向动态,尤其是在复合物背景下的构象变化研究,尽管这对预测和评估都是巨大挑战。
程建林教授列出了几个潜在方向:单序列预测、RNA预测若能达到AlphaFold2当年的碘伏性水平、以及蛋白质-小分子复合体预测取得根本性突破,都具有诺奖级的潜力。他总结道:“诺奖是对整个领域的承认,其最大影响在于吸引了前所未有的关注。如今,许多以往不关心结构预测的研究者,都在尝试用这些工具探索自己的生物系统或疾病问题。它已成为AI for Science的一个成功样板。从学术界角度看,仍有大量挑战性研究问题等待解决;而从产业界角度看,一个充满潜力的广阔市场正在展开。”
圆桌最后,与会专家还回应了观众关心的一些具体问题,例如对点突变蛋白质的结构预测(目前仍不敏感,是重要挑战)、柔性Loop区的预测(需结合其生物学功能上下文考虑,单纯预测意义有限)等。常珊教授总结道,诺奖是一个重要的里程碑,而这次讨论旨在让更多人了解结构预测的价值与未来,激励更多力量共同推动这一深刻改变生命科学的研究领域向前发展。
热门专题
热门推荐
近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十
科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,
SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。
NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。
OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。





