软件研发流程的智能化转型,正在从根本上解放开发者的生产力,引领软件工程领域实现范式革新。以北京大学计算机学院李戈教授为首的科研团队深耕该技术方向,并在鲲鹏昇腾科技创新卓越中心的算力支持下,成功研发出基于昇腾平台的智能化软件开发系统。通过应用大模型的自动化代码生成与优化技术,该系统实现了开发效率的显著跃升。

在对大模型aiXcoder-7B进行适配优化的过程中,其核心技术依托于代码生成技术所具备的意图理解与自动编程能力。这项技术通过对海量代码与注释语料的深度解析,精准识别开发者的编程意图,自动生成符合工程规范的高质量代码。昇腾平台提供的高性能算力为技术落地奠定了坚实基础,通过将模型从通用平台向昇腾NPU高效迁移,使得代码生成模型的训练与推理全流程获得硬件加速;同时集成优化的Flash Attention等关键算法,使其在昇腾硬件上能够高效运行,进一步增强了数据处理与模型计算效能。最终,该模型推理速度相比原版实现大幅提升,首Token延迟时间降低至原版的四分之一。
而在基于DeepSeek-V3 Agent的智能开发系统中,代码生成技术实现了从“单一编码”到“复杂场景协同”的能力升级。该技术创新性地将代码生成与工具调用能力相结合,能够应对多步骤开发任务并形成智能化运转。昇腾平台的SmoothQuant量化技术通过构造数学等价变换,使大模型中难以量化的激活值得到缩放并被轻松量化,并针对量化可能出现的性能波动,团队借助昇腾特性优化算法,有效抑制激活值异常,实现大模型的高性能、低精度部署;昇腾MindIE推理引擎提供类OpenAI高级封装接口和底层Token ID接口,使用底层的Token ID接口,可支持系统直接调用底层开发工具,实现更灵活定制开发,完善Agent工具调用能力,最终使系统具备代码补全、研发问答、缺陷检测等一站式开发能力。
此项研究成果推动软件开发进入“高效、智能、自主化”的新阶段,对广大开发人员具有里程碑意义。未来,北大团队将继续依托北京大学与鲲鹏昇腾科技创新卓越中心,探索新模型适配与领域化训练方法,让智能开发工具覆盖金融、能源、军工等行业领域,为我国自主创新技术体系注入全新动力。
