游乐游手机版
首页/科技数码/文章详情

北大团队发布DeepSeek-V3.2模型:推理提速15倍,成本直降95%

时间:2026-03-25 21:19
头图由AI生成智东西作者 王涵编辑 冰倩智东西3月25日报道,今天,北大系AI编程创企硅心科技(aiXcoder)推出轻量级模型aiX-apply-4B,该模型支持256K上下文,参数量仅4B,一张


头图由AI生成

智东西
作者 王涵
编辑 冰倩

智东西3月25日报道,今天,北大系AI编程创企硅心科技(aiXcoder)推出轻量级模型aiX-apply-4B,该模型支持256K上下文,参数量仅4B,一张消费级显卡即可部署。

该模型适用于企业级的代码修改场景,可自动识别修改意图、定位目标区域、保持原有格式与上下文结构,并将修改后代码应用到原始文件中。

基准测试方面,aiX-apply模型在Python、Java、JavaScript、C++等主流编程语言,以及JSON、Markdown等多类型文件格式的测试中,平均准确率达到93.8%,超越Qwen3-4B基座模型62.6%的准确度,甚至高于千亿级大模型DeepSeek-V3.2。


▲基准测试对比

在企业级生产环境实测中,aiX-apply模型在单卡RTX 4090上即可运行,推理速度每秒可达2000 tokens,对比DeepSeek-V3.2则需要在八卡H200环境下部署。同一任务场景下,aiX-apply模型算力成本仅为DeepSeek-V3.2的5%,推理速度则提升15倍。

在技术上,代码合并任务以“复述原文+局部修改”为主,存在大量可复用文本片段,aiXcoder团队引入自适应投机采样技术,通过更轻量的机制预判重复片段,压缩了端到端延迟时间。

一、准确性和稳定性均比肩DeepSeek V3.2

在超长代码文件的精确编辑和跨语言环境下的代码理解与生成等场景中,aiX-apply模型都有良好的范式泛化能力。

aiXcoder团队结合真实应用场景设计了泛化性的测评维度,包括随机替换代码边界占位符、处理超长序列代码、在不完整的代码文件中进行局部编辑,以及引入训练数据中占比极低甚至未显式覆盖的编程语言。

结果表明,aiX-apply模型通过专门的强化学习训练,在多维度泛化性测评场景中,其准确性和稳定性可以与DeepSeek V3.2比肩。


▲准确度与稳定性测试对比

二、采用真实企业场景数据训练,设定双重工程约束

aiX-apply模型的训练数据源自真实企业级场景下的代码提交记录。在此基础上,aiXcoder团队引入一致性审计机制,剔除训练数据中包含模糊上下文或无法推导出修改逻辑的冗余信息,确保“代码片段”与“变更结果”之间存在绝对确定的因果关系。

这意味着模型在训练阶段接触到的都是“逻辑闭环”的高质量数据,使其能够精准建立从修改意图到代码应用位置的深度映射。

aiX-apply模型在训练时会基于高性能强化学习框架不断生成代码修改内容,并结合规则化奖励机制进行评测。系统会实时判定修改是否正确、是否越界,再把结果反馈给模型。

通过端到端闭环训练,该模型在“生成-反馈-修正”的在线强化学习中持续对齐工程约束,始终在指定区域精准操作,杜绝因“幻觉”而导致的非必要代码改动,提升代码应用的准确性与可靠性。


▲模型架构

为适配代码变更应用这一垂直工程场景,aiX-apply模型设定了双重核心工程约束来保证代码合并过程高度可控、结果可预期:

首先是非副作用约束,模型仅修改指定改动区域,区域外内容严禁变动;

然后是安全失败策略,当代码上下文锚点不唯一、无法准确定位时,模型直接输出空结果,不做猜测性修改,避免污染代码库。

结语:aiX-apply轻量化部署,降低企业落地门槛

aiX-apply模型主打低成本、高性能与易部署,在企业私有化部署与工程化落地中较有优势。

成本方面,该模型单张消费级显卡即可高效运行。其轻量化架构降低了企业使用私有化AI的门槛,便于快速将智能化能力融入研发流程。

研发效率上,aiX-apply支持256K上下文,吞吐量达每秒2000 tokens,可在大规模代码库中完成实时、精准的自动化代码修复与集成。

工程可控性层面,该模型有效减少了AI幻觉引发的错误修改,降低人工审核成本与线上故障概率,能够提升企业研发流程的稳定性与规范性。

来源:https://www.163.com/dy/article/KOSU0R98051180F7.html
上一篇华为畅享90 Pro Max发布:巨鲸长续航,流畅新标杆 下一篇秘鲁等国驻华使节探访郑州OPPO快闪店,点赞Find N6折叠屏硬核科技
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5