不久前,中国农科院基因组所发布了一项重磅进展——《自然·遗传学》在线刊登了周永锋团队利用人工智能加速葡萄育种的最新研究成果。这项研究的核心意义在于:它有望将葡萄育种周期大幅压缩,同时针对葡萄农艺性状的预测准确率可达到85%。与传统育种方法相比,效率直接提升了400%。换句话说,未来想要培育出一个全新的葡萄品种,可能不再需要等待数年才能看到结果。这一突破也为其他多年生作物的精准设计育种开辟了新的路径。

周永锋团队自2015年起便深耕于葡萄设计育种领域。2023年,他们发布了首个完整的葡萄端粒到端粒参考基因组图谱,该研究曾登上《园艺研究》的封面。但精准“设计”育种仅凭单一基因组数据远远不够。为此,团队进一步发力:他们对包括野生种和栽培品种在内的9个二倍体葡萄品种进行了测序与组装,获得了18个端粒到端粒的单倍型基因组,再整合已有的基因组数据,构建出目前最全面、最准确的葡萄泛基因组(Grapepan v1.0),其总长度达到1.43Gb,约为单个参考基因组大小的3倍。
然而,这仅是基础性工作。要揭示基因与性状之间的关联,还需要海量表型数据。团队从近万份葡萄品种中精选了400余份具有代表性的材料,连续3年追踪调查了29个农艺性状,包括果穗大小、浆果中的代谢物含量、浆果尺寸、果皮颜色等,并据此构建了基因型图谱与性状图谱。通过数量遗传学分析,他们鉴定到148个与农艺性状显著关联的位点,其中122个为首次发现。值得注意的是,这些位点之间并非孤立存在——例如,可溶性固形物含量与浆果宽度的相关位点位置非常接近。此外,酿酒葡萄、鲜食葡萄以及美洲鲜食杂种这三类群体之间存在明显的分化区域,这些区域中隐藏着与浆果颜色、果皮涩味、浆果形状、果穗重量、果肉硬度、果实大小等性状相关的遗传位点。这表明,人类对农艺性状的歧化选择,正是推动酿酒与鲜食葡萄分化的重要驱动力。
拥有全面准确的基因组数据之后,核心问题随之而来:如何将这些数据真正应用于育种实践?这正是智能育种必须攻克的难关。周永锋团队的做法非常直接——引入机器学习,构建预测模型,通过计算评分在早期阶段判断个体的潜力,从而优化整个育种策略。
具体而言,他们先将性状与基因型数据划分为三部分:训练集、验证集和测试集。利用机器学习算法解析基因型与性状之间复杂的网络关系,在训练集上构建了首个葡萄全基因组选择模型。随后用验证集调整参数,最后通过测试集评估模型性能。结果令人振奋:结合结构变异信息与机器学习模型的计算多基因评分,预测准确率达到了85%。
这意味着什么?育种专家不再需要等到葡萄成熟才能判断其品质优劣——在幼苗阶段,模型就能预测出它未来可能的表现。不符合条件的幼苗可以提前淘汰,从而节省大量人工与土地资源。与传统杂交育种相比,效率提升立竿见影。可以预见,这种全基因组选择育种技术将在葡萄新品种创制中发挥巨大作用,彻底改变整个育种策略。
目前,这项研究已申请并获批6项国家发明专利,另有1项国际专利正在申请中。从基础基因组到表型网络,再到智能预测模型,这一整套体系正在推动葡萄育种从“靠经验碰运气”迈向“精准设计”。
