1月23日消息,国内科研团队在高性能计算芯片领域取得新突破。由北京大学人工智能学院孙仲研究员领衔的团队,成功设计并研制出一款专用于“非负矩阵分解”计算的模拟计算芯片。
测试结果显示,这款芯片在典型应用中,相较于目前主流的数字芯片,其计算速度可提升约12倍,能效比提升更是超过228倍。该研究成果已于1月19日发表在《自然·通讯》期刊上。

非负矩阵分解是一项广泛应用于推荐系统、图像分析、生物信息学等领域的数据降维与特征提取技术。
随着数据规模持续扩大,传统数字硬件在面对实时处理海量数据时,常常受限于计算复杂度高、内存访问瓶颈等挑战。
该研究团队长期专注于模拟计算技术路线。模拟计算利用物理规律直接进行并行运算,具有延迟低、功耗低的潜在优势。
此次,团队基于阻变存储器(RRAM)研发了专用的非负矩阵分解模拟计算求解器。他们创新地设计了一种可重构的紧凑型电路,通过对核心计算步骤的优化,实现了“一步求解”,从而显著优化了芯片的面积和能效表现。
为验证芯片的实际性能,研究团队构建了测试平台。在图像压缩任务中,该芯片在几乎不损失精度的同时,节省了约一半的存储空间。在电影评分数据集和更大规模的商业数据集上进行的推荐系统训练任务中,该芯片均展现出显著优于主流数字硬件的计算速度与能效。
孙仲表示,这项工作为非负矩阵分解这类约束优化问题的实时求解提供了新路径,展现了模拟计算在处理复杂现实数据方面的潜力。该技术未来有望推动实时推荐、高清图像处理及基因数据分析等应用向更高效、更低功耗的方向发展。
相关研究成果已发表于《自然·通讯》期刊。
