首页 游戏 软件 资讯 排行榜 专题
首页
AI
新加坡研究团队实现AI编程提速55% 代码边生成边执行新方法

新加坡研究团队实现AI编程提速55% 代码边生成边执行新方法

热心网友
12
转载
2026-05-14

新加坡管理大学与北京航空航天大学的联合研究,为提升AI编程工具响应速度开辟了新路径。这项发表于计算机科学顶会的研究提出,通过重构代码生成与执行的时序逻辑,可实现高达55%的端到端延迟降低。相关核心论文已发布于arXiv预印本平台,编号为arXiv:2604.00491v1。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新加坡研究团队发现:让代码边生成边执行,AI编程速度提升55%

观察人类程序员的编码习惯,会发现一个普遍模式:编程过程往往是迭代和非线性的。开发者常在多个代码块间切换、修改和调试,如同画家在画布上不断调整构图与色彩。因此,程序员通常只在完成一个相对完整的代码段后,才会执行测试。

然而,当前主流的大语言模型(LLM)代码生成方式却大相径庭。模型通常以严格的顺序逐词(Token)输出代码,且不会回溯修改已生成的内容。一旦输出,字符即被固定。基于这一关键洞察,研究团队提出了一个突破性构想:既然AI本身不具备回溯修改能力,为何不能让代码在生成的同时就启动执行?

这类似于优化烹饪流程。传统方式是备齐所有食材再开始烹饪,而新思路则是“边准备边加工”——西红柿切好即刻下锅煸炒,同时处理下一份食材。当最后一种配料就绪时,菜肴也已接近完成。研究团队将这种创新模式定义为“并行执行”,与传统“串行执行”形成鲜明对比。

从接力赛到流水线:工作模式的根本性变革

在传统串行模式下,整个流程如同接力赛跑:AI作为第一棒,需完整生成全部代码;随后,执行器作为第二棒才开始运行。这意味着在AI生成期间,执行器处于空闲等待状态,反之亦然。这种交替工作的模式造成了显著的资源闲置与时间损耗。

并行执行模式彻底颠覆了这一流程。它构建了一条高效协同的流水线:AI持续产出代码片段,执行器则实时运行已就绪的代码块。一旦AI生成出第一个可独立执行的单元(例如导入语句或变量定义),执行器便立即启动,无需等待程序全部生成完毕。这种生成与执行的重叠,极大地压缩了总体等待时间。

“Eager”系统:一个支持流式执行的创新框架

为验证这一理论,研究团队开发了一套名为“Eager”的原型系统。其命名颇具巧思:“eager”一词既意指“急切的”,精准概括了系统即时执行的特性;同时也是“Executing As you GEneRate”(随生成随执行)的首字母缩写。

Eager系统的工作原理,可通过一个三阶段流水线模型来阐释:

第一阶段:代码解析器(实时语法分析器)。它持续监控AI输出的代码流,像语法哨兵一样,利用抽象语法树(AST)技术实时识别Python等语言中已形成完整语法结构的语句单元,并将其与未完成的片段分离。

第二阶段:待执行队列(缓冲调度区)。被识别为完整的代码块在此处排队等待调度,类似于餐厅中已装盘的菜品置于传菜区。

第三阶段:执行器(智能运行时)。它负责实际运行代码块,并引入两项关键优化:一是“批量处理”,将队列中的多个短任务合并执行以提升效率,类似洗衣机集满一缸衣物再启动更节能;二是“选择性延迟执行”,对于函数定义、类声明等不产生即时副作用的声明性代码,执行器会暂缓运行,直到后续代码实际调用它们时才触发执行。

核心创新:早期错误检测与中断机制

Eager系统一个更具价值的特性是“早期错误中断”。在传统模式下,若程序中间某行存在语法或逻辑错误,用户必须等待整个代码生成并运行至该处才能获知错误。而Eager系统一旦检测到某个代码块执行失败,会立即暂停AI的后续生成,并将错误信息及当前已生成的所有代码即时反馈给用户。

这好比在烹饪中途发现误用了调料,最合理的做法是立即停止后续步骤,而非继续完成整道菜。该机制不仅避免了无意义的后续生成资源消耗,还带来了一个显著的附加优势。

实测效果:响应速度与修复效率的双重跃升

研究团队进行了广泛实验,覆盖数据分析、可视化等多种编程任务数据集,并测试了GPT系列、DeepSeek、Qwen等七种主流大模型,环境包括本地及Docker容器。

实验结果令人瞩目:

1. 延迟显著降低:在模拟测试中,Eager系统能够将83%至100%的代码执行时间“重叠”在生成过程中,用户感知延迟大幅降低。在实际端到端测试中,对于正确代码,总体延迟平均减少37%;对于包含错误的代码,得益于早期中断,延迟降低幅度最高可达55%。

2. 错误修复成功率提升:早期中断机制带来了意外收获。当AI仅收到“部分生成代码+错误信息”的反馈时,其修正错误的成功率,比收到“完整错误代码+错误信息”时高出2%至44%。原因在于,完整的错误代码可能将AI的思维禁锢在原有的错误逻辑中;而部分代码则为AI提供了重新规划后续逻辑的灵活性,这好比重新起草一份大纲比修改一份漏洞百出的完整文档更为容易。

理论深化:三种工作模式与优化路径

研究团队进一步构建了理论模型,将流程抽象为生成、检测、执行三个阶段,并推导出延迟的数学边界。分析指出了三种典型的工作模式:

生成瓶颈模式:AI生成代码的速度慢于执行速度。此时,几乎全部执行时间都能被隐藏,用户体验接近“即时响应”。

执行瓶颈模式:代码执行(如运行复杂计算或训练模型)耗时远超生成时间。此时,生成时间大部分可被隐藏。

平衡模式:生成与执行速度相仿,流水线达到理论最优效率。

该理论不仅合理解释了实验结果,也为未来系统优化指明了方向。例如,针对计算密集型任务,可能需要设计自适应的调度策略来应对执行瓶颈模式。

深远影响与未来应用展望

这项研究的意义超越了单纯的技术加速,它重塑了人机协同编程的交互范式。其核心理念——在不改变生成内容质量的前提下,通过优化交付流程来提升效率——具有广泛的启发性。

编程语言与工具设计:现有编程语言及IDE的设计基于“人类编写-完整执行”的假设。在AI深度参与编码的时代,未来的语言或开发环境是否需要原生支持“流式代码执行”?这是一个值得深思的议题。

产业应用场景:对于数据科学家和机器学习工程师,他们常编写包含数据加载、清洗、建模、评估等多个步骤的脚本。采用并行执行,意味着在AI生成数据预处理代码的同时,用户可能已能看到部分数据加载结果,从而能更早地发现数据质量问题并调整后续指令。

模型评估与部署策略:研究还揭示了一个反直觉的发现:生成速度较慢的模型,可能因为更充分地“隐藏”了执行时间,反而在整体用户体验上表现更佳。这提示我们,在评估AI编程助手时,单一的Token生成速度并非唯一指标,与执行环境的协同效率同样至关重要。

当然,研究团队也指出了当前方法的局限性,例如在处理涉及多文件、复杂依赖的大型项目时,其优势主要体现在主入口文件。但这恰恰为后续研究开辟了方向,例如开发更智能的跨文件代码分块策略、支持分布式执行的协作框架等。

归根结底,这项研究展示了一种高效的性能优化哲学:当提升核心能力(如AI的代码生成质量)面临边际效益递减时,转而优化其工作流程与交互模式,往往能带来显著的性能突破。这种从“串行等待”到“并行协作”的思维转变,或将成为未来AI应用设计与效率优化的重要范式。

常见问题解答(Q&A)

Q1:Eager并行执行系统的工作原理是什么?

A:Eager系统构建了一个三阶段实时流水线。代码解析器持续分析AI输出的代码流,识别出语法完整的语句单元;这些单元被送入待执行队列;执行器则从队列中取出代码块立即运行,无需等待整个程序生成完毕,从而实现代码生成与执行的并行化。

Q2:并行执行能带来多大的速度提升?

A:根据研究数据,在理想情况下,该系统能将83%至100%的代码执行时间隐藏在生成过程中。在实际端到端延迟上,对于正确代码,平均等待时间减少约37%;若代码包含错误,得益于早期中断机制,延迟降低幅度最高可达55%。具体提升效果受任务复杂度及AI模型生成速度影响。

Q3:早期错误中断为何能提升代码修复成功率?

A:早期中断机制使AI在生成过程中犯错后,仅接收到“部分已生成代码+错误信息”的反馈,而非完整的错误程序。这为AI提供了更大的设计自由度来重构后续逻辑,避免了被原有错误的完整代码结构所限制。实验表明,这种方式可将代码修复成功率提升2%到44%。

来源:https://www.techwalker.com/2026/0410/3183717.shtml
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

豆包与CodeGeeX AI编程工具功能对比详解
AI
豆包与CodeGeeX AI编程工具功能对比详解

豆包MarsCode与CodeGeeX是两款国产AI编程工具。豆包MarsCode由字节跳动开发,侧重中文环境与小程序生态,适合快速原型开发;CodeGeeX基于智谱GLM模型,支持本地部署,在信创适配与复杂代码生成方面更具优势,适合企业级项目。两者在语言支持、部署方式和应用场景上各有侧重,选择需依据具体需求。

热心网友
05.14
Claude md文件十万星开源项目如何重新定义AI编程
AI
Claude md文件十万星开源项目如何重新定义AI编程

在GitHub上,一个独特的现象正引发全球开发者关注:一个不包含任何实际代码的项目,其星标数量已突破10万大关。项目的核心贡献,仅仅是一个名为CLAUDE md的配置文件。这份由前特斯拉AI总监、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)总结的“AI编程四诫”,正在悄然重

热心网友
05.13
AI编程工具如何解决代码质量与输出不稳定难题
科技数码
AI编程工具如何解决代码质量与输出不稳定难题

AI编程市场快速增长,但企业级应用面临代码输出不稳定、技术栈分散、缺乏工程化管理和资产沉淀等挑战。当前产品多面向个人开发者,企业平台需具备统一规范、可控流程和资产复用能力。通过结构化语言、规格驱动和可视化工具可提升代码质量与效率,减少技术债务。企业需区分场景,合理规。

热心网友
05.13
AI编程安全漏洞致38万应用暴露 内网数据泄露风险激增
业界动态
AI编程安全漏洞致38万应用暴露 内网数据泄露风险激增

AI编程工具导致大规模数据泄露危机。研究发现,大量由非技术开发者创建的网页应用因默认公开且缺乏防护,暴露了医疗、财务等敏感信息。约40%的应用存在泄露风险,甚至可能被获取管理员权限。默认配置及用户安全意识不足是主因,这绕过了企业安全审查,造成空前规模的泄露。

热心网友
05.11
Swift学生挑战赛获奖者访谈:编程技能与创意表达在AI时代如何双赢
iphone
Swift学生挑战赛获奖者访谈:编程技能与创意表达在AI时代如何双赢

每年春季,苹果公司面向全球学生发起的Swift学生挑战赛(Swift Student Challenge)都会成为年轻开发者展示创意与技术的重要舞台。参赛者需运用Swift语言,在Swift Playgrounds环境中构建一个交互式App,并在三分钟内清晰呈现一个创新想法。2026年度的获奖名单现

热心网友
05.11

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

特斯拉CEO马斯克安保费用达480万美元 同比大幅增长71%
科技数码
特斯拉CEO马斯克安保费用达480万美元 同比大幅增长71%

特斯拉2025财年为首席执行官马斯克支付的个人安保费用达480万美元,较前一年增长71%。今年头两月支出同比激增超160%。该费用仅为其安保开支一部分,其名下其他企业也分担相关成本。费用增长源于投资者呼吁及本人确认的必要性,其日常安保规格极高,常由约20名保镖及医护人员随行。

热心网友
05.14
HATCHY币空投教程:如何免费领取HatchyPocket NFT
web3.0
HATCHY币空投教程:如何免费领取HatchyPocket NFT

HatchyPocket是融合DeFi与NFT的链上游戏平台,其代币HATCHY用于支付、治理与激励。玩家可孵化收集虚拟宠物,资产基于区块链。获取免费空投需关注官方社交渠道、参与测试网活动或贡献社区内容,但需注意安全防范与数量限制。该项目展现了游戏与区块链结合的新模式。

热心网友
05.14
京东AI技术如何赋能企业数字化转型与智能升级
科技数码
京东AI技术如何赋能企业数字化转型与智能升级

京东启动大规模数据采集计划,依托数十万员工与线下业务网络,在真实服务场景中采集超千万小时视频数据,构建高质量具身智能训练数据集。此举旨在破解物理AI落地的数据瓶颈,将日常履约场景转化为数据源头,为机器人从实验室走向现实提供关键支撑。

热心网友
05.14
受枷者三套满分阵容推荐 平民玩家通关攻略详解
游戏资讯
受枷者三套满分阵容推荐 平民玩家通关攻略详解

还在为《无期迷途》受枷者关卡发愁?小兵无视阻挡快速推进,BOSS物理抗性极高,防线频频失守?别担心,本文将为你详细解析三套高适配阵容攻略,助你轻松通关。即便是零氪、微氪玩家,也能稳定获取24万高分奖励! 法系速杀流:开局秒核,一击制胜 应对受枷者关卡,两大核心难点在于:无视阻挡的杂兵推进速度极快,而

热心网友
05.14
Warframe指挥官新手入门 第一关操作技巧完全指南
游戏资讯
Warframe指挥官新手入门 第一关操作技巧完全指南

握紧你的武器,指挥官!Vor的战利品之门已经开启——这不仅仅是一个新手任务,更是你蜕变为一名真正Tenno战士的震撼序章。无需担心经验不足,本关卡专为初入《星际战甲》宇宙的你设计,全程由引导者Lotus亲自指引。浩瀚的星际战甲世界,此刻正式为你拉开帷幕! 核心操作精通:位移如风,攻防一体 任务开始,

热心网友
05.14