游乐游手机版
首页/AI教程/文章详情

ESM作者6个月超越AlphaFold3 代码权重全开源挑战DeepMind

时间:2026-07-03 15:34
距离AlphaFold 3亮相已经过去了四个月,但说实话,由于代码没公开、访问次数还限得死死的,外界对它的原理、机制和实际效用,依然知道得不多。DeepMind团队说过,要等发布六个月后,也就是今年11月才会开源。 前两天,三位牛津学霸放出的复现版本也只完成了第一阶段,目前只能预测蛋白质,还无法延伸

距离AlphaFold 3亮相已经过去了四个月,但说实话,由于代码没公开、访问次数还限得死死的,外界对它的原理、机制和实际效用,依然知道得不多。DeepMind团队说过,要等发布六个月后,也就是今年11月才会开源。

前两天,三位牛津学霸放出的复现版本也只完成了第一阶段,目前只能预测蛋白质,还无法延伸到DNA、RNA等其他生命分子。

不过,AF3的“踢馆者”们正纷至沓来。最近一家名为Chai Discovery的初创公司发布了他们的新模型——Chai-1,能够对蛋白质、小分子、DNA、RNA、共价修饰等进行统一预测。

根据基准测试结果,Chai-1在药物发现相关任务上达到了SOTA水平,甚至超过了AlphaFold 3,以及Meta FAIR前ESMFold团队另起炉灶搞出的新模型ESM3。

性能出色只是其一。Chai-1团队还发布了一篇16页的技术报告,并开源了模型权重和推理代码——虽然仅限非商业用途。

开发者可以选择下载代码、本地运行、自行修改,也可以通过服务器在线调用。这个开放程度,让人不禁想起当年既有代码又有论文的AlphaFold 2。

模型发布后,HuggingFace的CEO直接发出在线邀请:不如在HF仓库上也托管一份权重。

IBM大佬Alex Kaplan甚至把Chai-1的发布称为“药物发现的ChatGPT时刻”。他表示,当下绝对是分子生物学的黄金时代,在可预见的未来,只需几行代码就能治愈所有疾病,而Chai-1或许就是AlphaFold之后朝这个目标迈出的重要一步。

蛋白质领域的「原生多模态」

技术报告提到,模型架构和训练策略大体遵循了AlphaFold 3的论文,但有一个关键区别:他们使用了截止到2021年1月12日的所有数据,只训练了一个模型,而不是针对不同评估分别训练,并且添加了一些新功能。

与大多数需要MSA(多重序列比对)的结构预测工具不同,Chai-1可以在没有MSA的情况下以单序列模式运行,同时保持相近的性能。除了利用序列信息,它还是一个“原生多模态模型”。除了直接从序列信息建模,它还能通过prompt接受新数据,比如实验得出的结合袋、接触点和对接约束条件。这些约束可以捕捉复合物中不同物质在不同粒度上的相互作用信息,作用类似于结构模板提供链内距离,但更侧重于链间距离。

对比实验显示,提供约束条件后,模型性能甚至能得到两位数的提升(图4A);不过为了防止模型过度依赖约束导致过拟合,训练时对这些特征采用了dropout。比如表位的约束——即使只有少量接触点或结合袋残基信息,也能使抗体-抗原结构预测的准确率翻倍,让AI在抗体工程中的角色更加实用。

根据DockQ上的可接受预测率基准,Chai-1比基于MSA的AlphaFold-Multimer模型(67.7%)更准确地折叠多聚体(69.8%)。这个结果让Chai-1成为第一个仅使用单序列信息、无需MSA搜索,就能以AlphaFold-Multimer水平预测多聚体结构的模型。

在PoseBusters基准上,仅给出蛋白质序列和配体化学成分信息时,Chai-1对配体预测结果的RMSD成功率为77%,超过了AF3的76%。

成立半年,拿出顶级模型

发布Chai-1的Chai Discovery成立于今年3月,是一家AI生物初创公司。就在9月9日,他们完成了3000万美元的种子轮融资,由Thrive Capital领投,OpenAI和Dimension Capital也参与了进来。交易完成后,公司估值已升至1.5亿美元。

目前Chai的员工还不到10人,但吸引了不少来自OpenAI、谷歌、Meta FAIR等顶尖机构的人才,大部分成员也曾在头部药物公司担任AI负责人。

联合创始人兼CEO Joshua Meier,本科和硕士毕业于哈佛大学计算机科学专业,还拿到了化学学士学位。他高中时就在美国计算机奥赛中拿过金牌水平的名次,并涉足生物技术创业,在OpenAI、谷歌、Meta FAIR、布罗德研究所等机构都有丰富的研究和工作经历。2021年,在FAIR工作的Meier和团队发表了一篇重要论文,创建了第一个Transformer架构的蛋白质语言模型ESM-1b,目前引用量已超过1800。

论文作者列表中还有不少熟悉的名字,包括当时还在哈佛的Pika创始人郭文景(Demi Guo),以及FAIR前ESM团队成员Alexander Rives、Zeming Lin、Tom Sercu和Jason Liu。根据LinkedIn信息,ESM团队解散后,Alexander Rives、Zeming Lin和Tom Sercu已去了初创公司EvolutionaryScale,他们不久前也发布了新模型ESM3。创立Chai Discovery前,Meier还曾担任生物技术公司Absci的首席人工智能官。

在种子轮中选择跟投的Dimension Capital投资人Za vain Dar最近发表了一篇文章,阐述了投资想法,并高度赞扬了Meier和他的团队。Za vain Dar表示,从2019年Meier先后入职Meta和OpenAI时,他们就非常关注Meier的工作。短短几个月内,Chai-1就能与业内财力雄厚、历史悠久的企业所开发的产品平起平坐,这让他们看到了一个“短小精悍”的团队能在极短时间内做出多少成就。

在Za vain Dar的文章和Chai Discovery的博客中,都谈到了当前阶段开放技术成果的重要性。虽然Chai-1已经取得了非常卓越的成就,但我们才刚刚站在起跑线上。要把生物学“从科学转变为工程”,还需要构建更成熟、更强调的基础模型,用于预测和重编程生化分子间的相互作用。Chai-1的团队表示,他们坚信长期的获胜策略需要透明度和开放实验,当今的生物技术从业者就可以免费且轻松地应用这些前沿技术,将其转化为药物发现领域的实用价值。

来源:https://www.aiagiai.com/3847.html
上一篇智谱AI背水一战全力对标OpenAI能否胜出 下一篇o1模型智商超120 1小时写出NASA博士1年代码 编程赛超越99.8%选手
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Claude Token节省十大实用技巧方案
AI教程 · 2026-07-04

Claude Token节省十大实用技巧方案

通过编辑而非追加消息、每15-20条消息开新对话、合并问题、利用Projects缓存、预设记忆、关闭附加功能、按任务选择模型、分散时段、避开高峰及开启超额使用,能有效减少上下文重读,节省Token。

硅基流动冲刺Token工厂第一股亏损反更值钱?
AI教程 · 2026-07-04

硅基流动冲刺Token工厂第一股亏损反更值钱?

硅基流动冲刺港交所“Token工厂第一股”,2025年营收5533万元,净亏损3 45亿元,毛利率-24%。两条业务线分化:公有云服务亏损严重,本地部署毛利率达82 5%。依赖中立第三方定位吸引资本,但面临原厂降价、大厂竞争及供应链风险,估值77亿背后存隐忧。

AI Agent的真正价值在于长在业务流程中
AI教程 · 2026-07-04

AI Agent的真正价值在于长在业务流程中

AIAgent需嵌入企业业务流程,而非仅作聊天工具。以零售品类管理为例,通过趋势识别、选品与货架规划,预计可带来2%—5%销售提升及10%P&L改善。设计需模块化、可整合,确保可解释性,重新界定人、AI与工具的关系。

后张雪峰时代大厂抢滩AI志愿填报
AI教程 · 2026-07-04

后张雪峰时代大厂抢滩AI志愿填报

AI高考志愿填报工具在大厂推动下普及,能快速整合信息、生成方案,但存在数据幻觉、同质化风险。它无法替代张雪峰式实用主义建议和信誉责任,志愿填报仍需个性化判断与深度信息。

阿里禁用Anthropic全系产品的理性风控决策
AI教程 · 2026-07-04

阿里禁用Anthropic全系产品的理性风控决策

阿里自7月10日起全员禁用Anthropic全系产品,因其ClaudeCode被发现存在隐蔽身份识别与隐写标记机制,且Anthropic曾指控阿里进行模型蒸馏。此举源于安全信任崩塌、中美AI博弈加剧,阿里同步换装自研工具Qoder,推动国产AI编码工具替代。