首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
英伟达开源AI框架Polar让Codex性能提升近600%

英伟达开源AI框架Polar让Codex性能提升近600%

热心网友
93
转载
2026-05-28

最近,英伟达的研究团队放出了一个开源新框架——Polar,在AI智能体开发圈里引起了不小的关注。这个框架的核心目标很明确:让现有的代码智能体(比如我们熟知的Codex、Claude Code、Qwen Code)能够无缝接入一种名为“广义相对策略优化”(GRPO)的训练方法,而且整个过程不会干扰智能体原有的工具调用、上下文管理这些核心工作流。简单说,就是给现有的“老伙计”们装上一个更强大的新引擎。

image.png

那么,GRPO到底是什么?它本质上是一种强化学习优化技术。你可以把它理解为一个聪明的“教练”,通过“奖励”信号来不断调整模型的决策策略,帮助它在需要连续做出多步判断的复杂任务中,找到更优的行动路径。在英伟达的这项研究中,GRPO被专门用来训练代码智能体,让模型在实际的编码、调试、提交补丁这一长串流程中,能够自我迭代,越做越好。

这背后反映了一个明显的趋势:智能体的强化学习训练,正从解决单一、独立的步骤,转向攻克那些冗长而复杂的流程性任务。比如,维护一个代码仓库、在浏览器中执行系列操作,或者与操作系统进行深度交互。这些任务高度依赖现有的执行框架,涉及多轮工具调用和复杂的上下文管理。如果硬要把这些框架改写成传统强化学习所需的标准环境接口,不仅工程难度巨大,还很容易丢失那些对训练至关重要的细微信号。

英伟达的Polar框架选择了一条更巧妙的路径。它没有去“重造轮子”,碘伏现有的智能体框架,而是选择在模型API的边界上“安置”智能体。这样一来,原有的运行逻辑得以完整保留。Polar相当于在执行框架和推理服务器之间扮演了一个“中间人”和“记录员”的角色。它兼容多种请求风格,能够悄无声息地捕捉关键的执行数据,并将其转化为可用于GRPO训练的有效信息。

从系统架构上看,Polar集成了任务提交、会话调度和状态持久化等一系列功能。通过对初始化、运行和后处理流程的精心优化,整个训练效率得到了显著提升。实验数据最有说服力:采用Polar框架结合GRPO方法训练的智能体,在权威的SWE-Bench Verified测试集上表现惊人。以Codex为例,其pass@1分数从原来的3.8%飙升至26.4%,提升幅度高达594.74%。

除了性能的飞跃,效率的提升同样亮眼。使用该框架后,训练时间缩短了约5.39倍,GPU的平均利用率也得到了显著改善。这意味着,未来开发更强大的智能体,不仅效果更好,所需的成本和等待时间也将大幅减少。这无疑为下一代AI智能体的训练铺平了一条更高效的道路。

来源:https://news.aibase.com/zh/news/28410
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

英伟达开源AI框架Polar让Codex性能提升近600%
AI资讯
英伟达开源AI框架Polar让Codex性能提升近600%

英伟达开源框架Polar让现有代码智能体无需改动即可接入GRPO强化学习训练。它作为中间层高效捕获数据并转化为训练信号,显著提升复杂任务处理能力。实验显示,采用该方法的Codex模型性能提升近600%,训练时间缩短约5 4倍,为高效训练下一代AI智能体提供了新路径。

热心网友
05.28
高通与虹软联合发布超域融合视频技术AI影像性能提升40%
AI资讯
高通与虹软联合发布超域融合视频技术AI影像性能提升40%

高通与虹软联合发布视频超域融合技术,基于骁龙平台深度优化,通过调度多硬件算力提升视频动态范围与影调层次,实现电影级画质,性能提升40%且功耗降低。AI还能依据自然语言指令自动筛选剪辑素材,简化创作流程,展现了软硬件协同推动移动影像向专业化、智能化发展。

热心网友
05.28
Notion AI桌面版新增深色模式并优化性能
科技数码
Notion AI桌面版新增深色模式并优化性能

NotionAI桌面客户端针对Windows和macOS平台发布更新,重点提升性能与优化深色模式。新版本加快了大型页面加载速度,减少多数据库切换卡顿,并改善团队协作同步效率。深色模式配色调整降低了视觉疲劳,字体渲染更清晰。AI功能响应速度得到提升,未来将聚焦稳定性和本地化AI功能。

热心网友
05.27
AMD ROCm软件栈性能优化显著提升AI推理效率
iphone
AMD ROCm软件栈性能优化显著提升AI推理效率

最新测试数据显示,AMDROCm软件栈在约14天内实现了显著的推理性能提升,主要源于软件层面的深度优化。通过融合mHC操作与RoPE哈达玛变换等技术手段,降低了CPU开销并提高了内存利用率。在FP4和FP8精度下的典型应用场景中,token处理能力同步增长,有效改善了大模型推理延迟问题。虽然目前与

热心网友
05.11
同功耗性能提升9%!英特尔公布18A-P关键数据:功耗大降18%
业界动态
同功耗性能提升9%!英特尔公布18A-P关键数据:功耗大降18%

同功耗性能提升9%!英特尔公布18A-P关键数据:功耗大降18% 在近期于夏威夷檀香山举办的VLSI 2026研讨会上,英特尔通过一篇编号为T1 2的论文,正式揭晓了其Intel 18A-P制程节点的核心性能指标。数据显示,与标准的Intel 18A节点相比,18A-P能在相同功耗下带来超过9%的性

热心网友
04.30

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Paralives首发销量充足 支撑后续开发无需DLC
游戏攻略
Paralives首发销量充足 支撑后续开发无需DLC

《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。

热心网友
05.28
比亚迪宋Ultra DM-i上市12.99万 承诺城市领航安全兜底
业界动态
比亚迪宋Ultra DM-i上市12.99万 承诺城市领航安全兜底

2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景

热心网友
05.28
折叠屏iPhone Ultra外观已定,第三方保护壳亮相
科技数码
折叠屏iPhone Ultra外观已定,第三方保护壳亮相

先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非

热心网友
05.28
山寨币ETF批量上市后市场表现分析 哪些项目值得关注
web3.0
山寨币ETF批量上市后市场表现分析 哪些项目值得关注

山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,

热心网友
05.28
即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄
游戏攻略
即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄

近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。

热心网友
05.28