华人团队打造生物AI架构师,让生物AI更懂生命语言
近日,美国弗吉尼亚理工大学博士生方燚和所在团队开发出一款名为 BIOARC 的智能系统,能够自动设计出来最适合处理生物数据的神经网络模型。简而言之,它是生物学自己的 AI 建筑师,能够设计出来真正理解生物密码的模型结构。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
它的核心思想是:无需依靠人工猜测,而是让 AI 自己探索成千上万的不同的模型结构,从中找出来最适合处理某类生物数据的那一个。

图 | 方燚(来源:方燚)
方燚告诉 DeepTech:“BIOARC 仅需相当于传统 Transformer 模型约二十分之一的参数量,即可实现更好的性能。从创新性角度看,这可能是首次采用数据驱动的方式,系统探索并确定适用于生物序列建模的最优架构。以往的设计多基于直觉和经验,而我们首次实现了通过自动化搜索来发现高效架构。”
那么,BIOARC 是怎么做到的?我们都知道假如一名人类设计师要设计一栋房子,那么至少在设计师的草图上,房间的大小、位置和连接方式都可以变化。BIOARC 也是这样,它可以把 AI 模型拆为几种基础的板块。
第一个板块是卷积神经网络,其非常擅长捕捉局部特征,就像放大镜一样可以看清楚 DNA 上的片段模式;第二个板块是 Transformer,其非常擅长理解长远距离的关联,就像望远镜一样可以看清楚基因中相隔很远的区域是如何互动的;第三个板块是 Hyena 和 Mamba,它们是两种比较新的模型,能够更加高效地处理超长序列。
BIOARC 所使用的模型比当前流行的大型生物 AI 模型要小很多,但是表现却更加优秀。在一些 DNA 任务上,BIOARC 模型的大小只有传统模型的二十分之一,但是效果却能得到显著提升。这说明:不是模型越大越好,而是结构越合适越好。
比如,在处理 DNA 序列的时候,BIOARC 发现高性能模型常常呈现出一种三层结构:先使用 Hyena 块捕捉长距离关系,再使用 Transformer 块理解复杂上下文,最后使用卷积神经网络块来提取关键局部特征。这种组合就像先观看整幅地图,再分析重要区域,最后聚焦的关键地标,一步步地理解整个序列的能力。
BIOARC 不仅能够设计模型,还可以充当顾问的角色。科学家们经常面临新的任务:比如分析某种病毒的 RNA,或者预测某个罕见蛋白质的结构。以前,他们得自己尝试很多模型,不仅费时而且费力。现在,他们只需要把任务描述输入 BIOARC 系统,它就能从知识库中找到类似的任务,并推荐之前表现最好的几种模型结构,从而可以大大节约研究时间和实验时间。
同时,BIOARC 内部还有一个智能助理系统,能够理解那些科学家使用自然语言描述的任务,然后进行语义匹配,而非只进行简单的关键词搜索。这意味着即使你描述得不太专业,它也能明白你的需求,并能找到最相关的历史案例和模型方案。

(来源:https://arxiv.org/abs/2512.00283)
我们当前使用的 AI 大多使用的是 Transforme 模型,它最初是为处理人类语言而设计的。但是,生物数据比如 DNA 序列或蛋白质结构,和人类语言是完全不同的。前者不像句子那样有着明确的单词和语法,而是由一系列化学密码组成,其间隐藏着复杂的空间结构和远程关联、
举个简单的例子,在英文句子中单词“猫”后面常接“抓老鼠”,这种关系是局部的和有顺序的。但是,在 DNA 中一个基因的启动区域可能和几千个碱基意外的另一个区域发生相互影响之后,才可以启动生命活动。如果直接使用处理语言的 AI 模型去读 DNA,就像使用英文语法去理解一段音乐乐谱一样,虽然都是符号,但是规则完全不同,效果自然也就不好。

(来源:https://arxiv.org/abs/2512.00283)
而本次技术则具有广泛的应用前景。任何涉及蛋白质或 DNA 序列分析的场景都可能受益,例如对特定物种的 DNA 进行分类,或预测蛋白质结构。此外,由于此次发现的架构具有一定可解释性,未来亦有望帮助揭示更多潜在的生物学规律。
谈及本次技术和 AlphaFold 等已有工具的关系,方燚表示:“AlphaFold 属于生成式模型,需将序列映射到潜空间进行结构生成。我们的工作则能帮助构建更优的序列编码器,从而更有效地将蛋白质或 DNA 映射到统一的表征空间中,与现有工具形成功能上的互补与增强。”

(来源:https://arxiv.org/abs/2512.00283)
他继续说道:“关于后续研究计划,我们希望将当前方法拓展到更多模态上。目前工作集中于 DNA 和蛋白质序列,下一步计划将其应用于基因表达值序列等数据类型。另一个方向是,当前研究主要针对单模态架构,未来我们也将探索多模态架构,例如在同一模型中处理多种数据类型,并研究不同模态间是否存在最优的架构组合方式。”
参考资料:
相关论文 https://arxiv.org/abs/2512.00283
运营/排版:何晨龙
相关攻略
这项由香港科技大学、京东探索研究院和香港大学联合开展的研究发表于2026年3月,论文编号为arXiv:2603 17051v1。有兴趣深入了解的读者可以通过该编号在学术数据库中查询完整论文。制作一段
机器之心编辑部2025 年 4 月,Sand ai 开源了 MagiAttention v1 0 0,定义了下一代分布式 Attention 的全新设计和系统框架。历经一年的深耕,今天Sand ai
3月25日,鸿蒙智行最新发布了问界M6第一期答网友问,透露了问界M5系列的后续计划。鸿蒙智行最新表示,问界M6上市后,问界M5将持续在问界家族产品序列中稳定运营。该产品已收获了超15万用户青睐,将
编辑|杜伟过去两天,全球爆火的 Agent 私人助手 OpenClaw,接连更新了两个版本,让人直呼「开发团队是不睡觉了吗?」之所以如此爆火,很大程度上归功于 OpenClaw 的长期记忆能力,它能
来源:科技日报科技日报记者 张梦然国际顶级学术期刊《自然》近期正式发表了一项汇聚人工智能(AI)与生命科学顶尖智慧的里程碑式成果。由美国Arc研究所、英伟达公司,联合斯坦福大学、加州大学伯克利分校及
热门专题
热门推荐
华硕联席CEO许先越:苹果MacBook Neo冲击PC生态圈,定位“笔记本形态iPad” PC行业最近又迎来一个重磅话题。科技媒体PCMag日前报道称,在近期的财报电话会议上,华硕联席CEO许先越发表了一个引人瞩目的判断:苹果推出其最便宜的MacBook Neo笔记本,对整个PC行业而言,无疑是一
安伯尼克 Anbernic RG VITA 系列掌机规格揭晓:紫光展锐 T618 瑞芯微 RK3576 芯片 安伯尼克 Anbernic 于昨日通过视频,正式揭开了RG VITA及VITA Pro两款掌机的详细规格面纱。对于关注掌上游戏设备的玩家来说,这波参数放送,信息量着实不小。 具体两款机型
在龙族卡塞尔之门的战场,皇女零的阵容搭配艺术 想在《龙族卡塞尔之门》的战场上最大化皇女零的威力?阵容的搭配可是一门学问。她自身无疑是核心的输出利器,但要让这把利刃发挥极致,就得围绕她构建一个既能稳固防守、又能创造绝佳输出时机的团队。 核心角色选择:强攻与辅佐的默契 皇女零的定位清晰——核心输出。因此
XRP ETF:2025 年的最新发展 如果说2024年是比特币和以太坊ETF的“破冰之年”,那么2025年的聚光灯,无疑转向了XRP。随着现货比特币和以太坊ETF成为主流金融机构的标准配置,全球市场的目光正聚焦于下一个可能爆发的领域:XRP及其各类交易所交易基金(ETF)。从基于期货的美国产品到已
飞读小说APP:三步“读心术”,精准找到你的下一本心头好 面对海量书库,如何在飞读小说里高效率地挑出那本合胃口的好书?这事说难也简单,关键在于摸清楚平台的推荐逻辑和筛选工具。今天,我们就来把这套“选小说”的实用方法论,给你讲明白。 飞读小说app小说选择方法: 第一步,精准定位你的“阅读舒适区”。打





