微软发布代码生成新技术,单次可输出36K行高效代码
自然语言规划的模糊性让仓库生成屡屡翻车。微软 RPG 用图谱取代文字,节点代表功能与文件,边标注依赖与接口。基准显示,功能创新率 11-13%,代码通过率 69.7%,远超 Claude Code,为大规模 AI 开发铺平道路。

近年来,大模型写代码的能力突飞猛进。在函数级、文件级上,生成已相当可靠;开发者一句描述就能得到完整函数或模块。
但当视野扩展到整个仓库时,难题随之而来:数十上百文件、类与函数之间交织着复杂依赖,要从抽象描述落到完整仓库,始终充满挑战。
现有方法多依赖自然语言规划来决定「做什么、怎么做」。这种方式虽直观,却天生模糊、缺乏结构,难以长程稳定地追踪依赖。
结果就是两类常见失效:要么功能提案不全,难以覆盖需求;要么实现过程漂移,接口和模块边界逐渐错乱。

为解决这一问题,微软提出了 Repository Planning Graph (RPG),以结构化图谱替代脆弱的文字规划,把功能、文件、依赖和数据流统一在一张蓝图中,从而让仓库生成首次具备可控、可扩、可验证的基础。
从需求到仓库的统一蓝图
Repository Planning Graph (RPG) 是一种结构化表征,它把仓库生成的全过程统一到一张图里。
RPG 的节点可以是功能目标、文件、类或函数,边则显式标注接口调用、依赖关系和数据流动。
这种设计既能回答「要实现什么」(提案层),也能回答「如何实现」(实现层),从而保证高层意图与底层实现的一致性。

在此基础上,研究团队提出了 ZeroRepo 框架。ZeroRepo 从用户的自然语言描述出发,分三步逐步构建 RPG 并在其指导下生成代码:
第一步:提案级构建
ZeroRepo 不再让模型「即兴发挥」,而是先把用户的自然语言需求落到 RPG 上,逐步长成一张功能图谱。
它依托一个庞大的功能树去检索和拼接节点,比如「用户登录」「购物车管理」「支付处理」,像搭积木一样组合成完整蓝图。
这样,系统不但覆盖了所有关键功能,还能保证结构清晰、层次合理。
第二步:实现级构建
有了功能蓝图,还需要明确每个模块「落地到哪里」。
ZeroRepo 会把功能节点继续展开,写成具体的文件、接口和数据流,并一一标注进 RPG。以「支付处理」为例,它会被拆解成 payment_service.py、api / payment_api.py 等文件,并明确依赖订单与库存模块的输出。
这样,模块间的边界和依赖被牢牢固定,再也不会在生成过程中走偏。
第三步:图驱动生成
最后,ZeroRepo 按照 RPG 的拓扑顺序推进代码生成。每实现一个文件或函数,就会先生成测试用例,再写函数体,并把结果回写到 RPG 中。
这形成了「生成 — 验证 — 更新」的闭环。
整个过程像是沿着蓝图施工:有规划、有校验,仓库规模不断扩展,但始终保持接口对齐、结构稳定。
实证 ZeroRepo:从蓝图到真实仓库
为全面评估仓库级生成能力,他们构建了全新基准 RepoCraft。

不同于以往依赖现成仓库或提供详尽文档的设置,RepoCraft 不提供完整架构蓝图,还涵盖 6 个真实项目、共 1052 个任务:
scikit-learn,pandas,requests,django,statsmodels,sympy。
真正考察模型从模糊需求到结构化实现的能力。

功能覆盖与规模:覆盖率达 81.5%,比最强基线 Claude Code 高 27.3 个点;还能生成超 100 个新功能(创新率 11–13%),远超其他方法。生成仓库平均 36K 行代码、445K tokens,是 Claude Code 的 3.9 倍、其他方法的 64 倍,复杂度接近人工项目。
正确性与一致性:代码通过率为 69.7%,比 Claude Code 高 35.8 个点,接近人工项目上限(81%)。RPG 的结构化约束有效保证了模块边界和接口设计的一致性,使生成结果更稳定、更贴近设计初衷。

复杂依赖与协同:以 Qwen 3 Coder 生成的结果来看,RPG 不仅清晰组织了文件层次和模块流程,还显式捕捉了跨模块调用与反馈依赖,使复杂关系能够被稳妥管理,仓库在复杂度提升的同时仍保持整体协调。

随着迭代次数增加,RPG 引导的规划让新功能和新增代码能够稳步扩展,而不是像基线方法那样在早期就陷入停滞。这样的线性扩展能力证明他们具备支撑大规模仓库持续开发的潜力。

此外,RPG 提供的全局结构视角显著提升了代理的仓库理解与定位能力,使其能够更快地追踪依赖、定位问题并完成模块集成,从而加速整个开发流程。
总结与展望
ZeroRepo 展示了结构化图谱在仓库生成中的独特价值:它不仅提升了功能覆盖率、代码规模和正确性,还解决了长期困扰自然语言规划的模糊与漂移问题,使自动化仓库生成首次逼近真实的软件开发过程。未来,研究团队计划进一步拓展 RPG 的适用范围,包括支持多轮需求变更下的交互式开发、跨仓库的协同演化,以及与现有工程工具链的深度融合。
参考资料:
https://arxiv.org/abs/2509.16198
相关攻略
微软向WindowsInsider推送Win11最新预览版,新增“屏幕色调”辅助功能以降低亮度,讲述人支持即插即用盲文显示器,语音访问加入语音隔离技术以提升识别率并保障隐私。此次更新聚焦无障碍体验优化与智能交互的精准安全。
Mac版Teams应用频繁弹窗请求定位权限,微软确认问题源于近期macOS安全更新导致应用无法保存用户设置。目前微软与苹果正协同排查,寻求根本解决方案,并评估从应用端优化的可能。受影响系统包括macOS多个版本,但范围有限。用户可尝试在系统设置中重置相关定位权限以暂时缓解问题。
2026年4月27日,微软针对Windows 11 24H2版本推出了一项关键的电源管理优化,重点改进了“现代待机”(Modern Standby)机制。简而言之,系统默认的电源策略变得更加主动和高效——当设备处于闲置状态时,屏幕关闭和系统进入睡眠模式的速度将显著提升,从而有助于节省电力。 具体而言
微软官方通知邮箱被不法分子长期滥用,用于发送伪装成安全提醒的诈骗邮件。该漏洞使诈骗者能通过注册账号冒用官方渠道,误导性极强。尽管问题已持续数月并被外部组织通报,微软至今未彻底解决。此类利用企业官方系统进行诈骗的现象日益增多,已成为行业共同面临的安全挑战。
微软内部警示GitHub面临生存风险,因AI编程工具正削弱代码托管必要性。微软虽以Copilot引领AI编程,但竞争对手产品快速发展,重塑开发者工作流。微软内部试用后强制转向自家工具,旨在控制成本并巩固生态。同时,OpenAI考虑自建托管平台,进一步威胁GitHub根基。AI正深刻改变代码生成与管理方式。
热门专题
热门推荐
访问币安Binance时,确保通过官方网站登录是保护您数字资产安全的首要步骤。网络中充斥着大量仿冒网站,它们旨在窃取您的账户信息。因此,使用可靠的官方渠道直接访问至关重要。 币安binance官网入口: 币安Binance官方APP下载: 如何辨别币安官方网站 第一步,也是最关键的一步:仔细核对浏览
为了确保您的数字资产安全,请务必通过币安Binance官方认证渠道访问 直接进入安全平台,是防范网络钓鱼、保障账户安全最关键的一步。这个简单的习惯,能有效将恶意网站隔绝在外,防止它们窃取您的个人信息与资产,为您的每一次交易保驾护航。 币安binance官网入口: 币安Binance官方APP下载:
欧易OKX官方安卓APPv6 142 0版本提供安全下载与安装指引,确保用户获取正版应用。指南详细说明了从官方渠道下载安装包到完成安装的全过程,帮助用户避免潜在风险,保障资产安全。
欧易OKX官方网站及移动应用程序提供了安全的官方下载渠道。用户可通过指定链接直接访问官网,或获取安卓与苹果iOS系统的APP安装包。为确保资产安全,务必通过官方渠道下载,避免使用非官方来源。
节假日期间ClawBot话术切换慢,通常因专属提示词模板缺失、活动参数未注入或策略未绑定活动ID所致。可通过四步解决:配置节日专属模板并热生效;绑定活动ID与话术策略;注入实时促销参数;最后进行灰度测试与数据优化,确保话术准确高效。





