首页 游戏 软件 资讯 排行榜 专题
首页
手机教程
AutoDev Planner:推理模型规划编码任务,DeepSeek R1 延伸 Vibe Coding 可能性

AutoDev Planner:推理模型规划编码任务,DeepSeek R1 延伸 Vibe Coding 可能性

热心网友
75
转载
2025-04-23

最近,我们在 autodev 上推出了一个新的功能:autodev planner,这是一个基于 deepseek r1 推理模型构建的编码任务规划工具。当然,除了 deepseek r1 之外,你也可以选择使用其他模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

AutoDev Planner:推理模型规划编码任务,DeepSeek R1 延伸 Vibe Coding 可能性在 AutoDev Planner 中,AI 将根据你的输入和收集的上下文,生成一个用于后续编码的任务计划。这个计划随后可以由其他更适合指令遵循的模型,如 DeepSeek V3,来生成代码、编辑代码等。

引子 1:AI 编码任务的进度显性化在设计 AI 编码 Agent 时,一个有趣的点是用户如何感知编码任务的进度,即用户是否应该显性地看到进度,还是隐性地感知进度。

Copilot Workspace:早期的 AI 显性任务AutoDev Planner:推理模型规划编码任务,DeepSeek R1 延伸 Vibe Coding 可能性去年,我尝试使用 GitHub Copilot Workspace 来帮助我进行前端开发工作。我尝试了几十个小的需求点,即使只是简单的 i18n 翻译,它的表现并没有达到我的预期,可能是因为受限于 GPT-4 的能力。Copilot Workspace 的思路确实非常不错:

Brainstorm。对用户的 Task 进行头脑风暴(Brainstorm)Task。将 Task 转换为一个可编辑的 PlanExecute。执行 Plan,生成代码 Pull RequestPR。将变更以 Pull Request 的形式提交你可以显性地看到 AI 思考、编辑、执行的过程,当然它没有动态地调整计划,而是一次性生成(基于 2024 年的认知)。

Cursor:AI 隐性任务下的自动化重试AutoDev Planner:推理模型规划编码任务,DeepSeek R1 延伸 Vibe Coding 可能性回到最近一年多特别火热的 AI 编码工具 Cursor,它构建了非常好的 AI Editor 体验,用户提出一个问题。它会:

自动收集 IDE 中的上下文对代码进行编辑在代码出现 Lint 问题时,自动修复;在代码出现错误时,自动重试……你可以通过文字大致了解 AI 做了什么,但大量的重试让你几乎感觉不到过程的存在。

JetBrains Junie:动态的 AI 任务规划AutoDev Planner:推理模型规划编码任务,DeepSeek R1 延伸 Vibe Coding 可能性JetBrains Junie 是最新的 AI 编码工具之一,它构建了一个动态的 AI 任务规划体验。用户提出一个问题。它会:

结合分析问题,理解用户意图,生成一个任务计划按步骤执行每个任务,并根据需求再获取上下文在任务执行过程中,动态调整计划,以适应用户需求在过程中,你可以看到它的计划在不断调整和迭代,直到最终完成用户的 issue 或者不能完成。

引子 2:推理模型规划任务的想象空间众所周知,2024 年底的推理模型或者说“可深度思考模型”,带来了更多的想象空间与可能性。我们在 AutoDev Sketch(类似 Cursor Composer 的自动编码 Agent)中进行了一系列实验,发现与其他国内模型相比,DeepSeek R1 在相同上下文下,更容易生成更好的工具调用(基于 DevIns 指令)。与 DeepSeek V3 相比,DeepSeek R1 调用了更多的工具。

理想情况下,我们应该用 R1 进行首轮工具对话和第二轮的任务规划,但 R1 的速度确实太慢了,从时间上来看相当于多调用了一轮 API。然而,R1 的优势依然显而易见,相信大家也有相似的感受和体验。

当然,我们没有进行大规模的实验,因为构建非常好的测试数据集是非常耗时的。

AutoDev Planner:Agent 编程的任务规划基于上述的思考,我们构建了新的拟人功能:AutoDev Planner,以增强 Sketch 的任务规划能力。AutoDev Planner 的核心功能是:

AutoDev Planner:推理模型规划编码任务,DeepSeek R1 延伸 Vibe Coding 可能性可见的任务规划。通过 Pin 及 Planner ToolWindow 可以看到当前的任务进度动态的任务规划。AI 会根据上下文动态调整任务规划(取决于模型,有时候并不会实时更新)手动执行未完成的任务。用户可以手动执行未完成的任务,以便更好地调整任务规划规划 Review。用户可以手动调用模型来 Review 任务规划(为什么不是自动的,因为 token 对普通用户来说是非常昂贵的)总体思路还是非常简单的,就是调用模型生成计划,然后展示这个交互。

关键点 1:基于推理模型的任务规划由于推理模型与普通模型在理解 prompt 和遵循指令的能力上存在差异,我们原先用于 V3 的 prompt 并不适用于 R1。因此,我们需要重新设计 prompt 以适应 R1 的能力。

简单来说,就是在完成了初步的上下文收集之后,而且用户配置了推理模型之后,我们会调用 R1 来生成一个任务计划。这个任务计划会包含:任务、步骤及其相关的进度情况,随后我们会将这个计划展示给用户。

关键点 2:任务规划的可交互性与其他 AI 编码工具不同,我们认为任务规划是一个非常重要的交互,因此我们提供了一些交互功能:

任务的状态显示:完成的任务将会被标记为完成未完成的任务可以手动执行Pin。用户可以将任务 Pin 到 IDE 的某个位置,以便更好地关注文件交互。考虑到模型的能力,当文件出现在任务中,可以点击文件名打开文件编辑。当用户觉得任务规划不合适时,可以暂停并及时调整任务。review。用户可以手动调用模型来 Review 任务规划通过可视化任务来构建更好的 AI 编码体验,这是 AutoDev Planner 的初衷。

总结AutoDev Planner 是一个基于推理模型的任务规划功能,它可以帮助用户更好地理解 AI 编码任务的进度,以及更好地调整任务规划。当然,它还有很多不足之处,欢迎在 GitHub 上提出 issue 和 PR。

来源:https://www.php.cn/faq/1287583.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

FDUSD 脱锚危机之下:对币安影响几何?
web3.0
FDUSD 脱锚危机之下:对币安影响几何?

FDUSD脱锚惊魂夜:币安生态稳定币的信任危机与系统性风险 2025年4月2日夜间,加密货币市场经历了一场突如其来的“压力测试”。由香港First Digital Trust Limited发行的美元稳定币FDUSD,在市场上演了惊心动魄的脱锚跳水,其兑USDT价格一度暴跌至0 8726美元。这场震

热心网友
04.01
Obsidian同步方案对比:为什么Git更适合管理笔记库?
科技数码
Obsidian同步方案对比:为什么Git更适合管理笔记库?

最近又折腾了下 Obsidian 的 Git 插件,虽然也有点麻烦,但它是适合我的。下面介绍下怎么配置和使用。 第一次使用 Obsidian 是在 2024 年,这是翻阅之前的文章 《Obsidia

热心网友
02.13
华为8B代码模型突破,32B巨头对手面临新挑战
科技数码
华为8B代码模型突破,32B巨头对手面临新挑战

这项由华为技术有限公司、南洋理工大学、香港大学和香港中文大学联合完成的突破性研究发表于2026年1月,论文编号为arXiv:2601 01426v1。研究团队通过一种名为SWE-Lego的创新训练方

热心网友
01.10
Wavesurf Wave13发布:集成SWE-1.5模型与Git工作流,重塑AI代码编辑
电脑教程
Wavesurf Wave13发布:集成SWE-1.5模型与Git工作流,重塑AI代码编辑

12 月 27 日消息,科技媒体 NeoWin 今天(12 月 27 日)发布博文,报道称 AI 代码编辑器 Windsurf 本周发布 Wave 13 版,通过大幅升级多智能体工作流、性能可访问

热心网友
12.29
小蚁NEO:特性、交易与投资指南
web3.0
小蚁NEO:特性、交易与投资指南

NEO(小蚁区块链)旨在构建智能经济网络。NEO通过资产数字化和智能合约实现自动化管理,用户需在支持NEO交易的平台注册账户并获取数字货币,选择合适的交易对后,即可下单交易并确认。交易完成后,可在账户中查看NEO资产,或转移至个人数字储存中安全保管NEO。

热心网友
12.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08