
近日,由中国科学院自动化研究所李国齐、徐波团队联合沐曦 MetaX 共同研发的全球首个类脑脉冲大模型“瞬悉 1.0”(SpikingBrain-1.0)正式亮相。该模型基于自主研发的国产千卡 GPU 算力平台,完成了从训练到推理的全流程实现,在超长序列处理方面展现出数量级的效率与速度提升,标志着我国在类脑计算与大模型融合领域取得重要进展。
此次研发工作依托研究团队此前在内生复杂性理论方面的研究成果,提出了一种全新的大模型架构方式。该架构借鉴大脑神经元内部复杂运作机制,建立了脉冲神经元内生动力学与线性注意力模型之间的理论联系,首次明确指出当前线性注意力机制实质上是树突计算的一种特殊简化形式。这一发现为未来持续提升模型复杂度与性能提供了理论依据与实现路径。
基于该理论,研发团队构建并开源了 SpikingBrain-1.0-7B 模型,同时开放了 SpikingBrain-1.0-76B 的测试访问接口。技术报告显示,该系列模型已在工业场景中完成大规模验证,具备良好的应用前景。此外,团队还自主研发了面向国产 GPU 集群的高效训练与推理框架、Triton 算子库、模型并行策略及集群通信机制,全面适配国产算力平台。
作为全球首个实现全流程国产化的类脑脉冲大模型,“瞬悉 1.0”的问世不仅展示了我国在非 Transformer 架构大模型生态建设上的潜力,也为法律、医疗、科学模拟等需要处理超长序列信息的领域提供了更高效的技术支持。研究负责人表示,这项成果将对未来神经形态计算理论的发展以及下一代类脑芯片设计产生深远影响。
