澳洲牧羊人用AI编程革新 Claude Code推出强制目标完成模式
【深度解读】澳洲开发者三行Bash脚本引爆AI编程革命:OpenAI、Anthropic、Hermes 11天内集体跟进,AI编程进入“闭环交付”时代
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
AI编程领域迎来重大突破!Claude Code 近日重磅更新,推出了一项改变游戏规则的新功能:/goal 目标驱动模式。
通过设定明确目标,Claude Code 现在能够像不知疲倦的助手一样,持续工作直至任务完成为止,彻底解决了AI编程工具“半途而废”的痛点。

只需输入一个指令,Claude 便会进入全自动工作状态,不达目标绝不停止。

对于任何使用过AI编程助手的人来说,这一功能的价值不言而喻。
你是否遇到过这样的场景:向AI助手下达一个复杂的编程任务,它执行了几步、修改了几个文件后,突然停下来询问“接下来需要我做什么?”,而实际上,关键的Bug修复或功能实现尚未完成。
这种“任务中断”问题长期困扰着开发者。

尽管AI智能体(Agent)在代码生成速度和理解能力上飞速进步,但“独立、完整地完成一项任务”这一核心能力,直到2026年初,仍是行业普遍面临的挑战。
然而,一位来自澳大利亚的开发者Geoffrey Huntley,仅用三行Bash脚本就提出了一个开创性的解决方案。
- while:;do
- cat PROMPT.md | claude-code --continue
- done
他将这个脚本命名为Ralph Loop,灵感来源于《辛普森一家》中那个屡败屡战、永不放弃的角色Ralph Wiggum。
其逻辑简单而强大:构建一个无限循环,持续将同一个任务指令(Prompt)喂给AI智能体。工作进度通过文件系统和Git历史记录来保存,当上下文窗口耗尽时,便启动新实例,读取文件状态后继续执行。

这个方法虽然原始,却异常有效。
其有效性迅速引起了行业巨头的注意。OpenAI看到了,Nous Research看到了,Anthropic也看到了。
在短短11天内,这三家顶尖的AI实验室不约而同地将“Ralph Loop”的核心思想整合进了各自的官方产品中。
这一事件标志着一个行业共识的形成——
迈向通用人工智能(AGI)的关键一步,或许不在于制造更“聪明”的模型,而在于打造更“可靠”、能“有始有终”的模型。
换言之,AI编程竞争的核心,正从“代码生成能力”转向“任务闭环交付能力”。
11天,三大厂商,殊途同归的解决方案
4月30日,OpenAI的Codex率先集成了/goal功能。
Greg Brockman在X上简洁地宣布:“Codex now has Ralph loop++ built in.”

一周后,Hermes Agent迅速跟进。四天之后,Claude Code也加入了战局。
11天,三家巨头,围绕同一个核心需求,推出了相似命名的功能。
但三家的技术实现路径却截然不同,各有侧重。
简而言之:Codex解决了“记忆持久化”问题,Hermes构建了“防故障体系”,而Claude Code引入了“第三方验收”机制。

OpenAI Codex:将目标持久化为数据库记录
OpenAI是三家中最先响应的,其方案也最为简洁和工程化。
在Codex中,/goal被实现为一个持久化的工作流对象,直接存储在本地的应用服务器状态层中。
这意味着,即使你关闭终端、合上笔记本电脑甚至重启系统,你设定的目标都不会丢失。下次打开Codex时,它会自动从上次中断的地方无缝衔接,继续工作。

模型通过一个结构化的`update_goal`工具来汇报进度。当Token预算耗尽时,系统触发的是“优雅暂停”而非强制终止。
已有用户利用此功能让Codex连续运行了14个小时,中间暂停5小时休息后,回来发现Codex能从断点处准确恢复,最终成功完成了一个复杂的设备驱动开发项目。
整个方案体现了工程师思维的克制与优雅。

Hermes Agent:单兵作战不够,就上团队协作
相比之下,Hermes Agent的架构野心更大。
在这里,/goal只是其庞大系统的一环。真正的核心是其强大的多智能体看板系统。Hermes将“让AI完成工作”的命题,从单智能体的耐力挑战,升级为了多智能体的协同作战。

看板底层基于本地SQLite数据库,同样具备持久化存储能力,重启后数据不丢失。
当你在看板上创建一个任务卡片时,Hermes会自动将其拆解为多个子任务,并分配给不同的Agent工作进程。每个工作进程都是独立的操作系统进程,拥有自己的身份、模型配置和工作目录。
/goal与看板系统相辅相成。/goal负责锁定单个Agent的长期目标(即Ralph Loop的核心),而看板则负责协调多个Agent之间的任务调度与协作。一个纵向深化,一个横向扩展。
最令人印象深刻的是其五层“防烂尾”保障机制,堪称智能体领域的“安全生产标准”。
第一层,心跳检测。每个工作进程必须定期向看板“签到”,证明自己仍在运行。
第二层,僵尸回收。工作进程超时无响应?系统自动判定其“失活”,回收其任务并重新分配给其他进程。在macOS上,甚至有针对性的达尔文僵尸进程检测逻辑。
第三层,退出拦截。工作进程未完成任务就退出?系统会自动将其标记为`blocked`,阻止其领取新任务,防止出现“只领任务不干活”的无效Agent。
第四层,幻觉拦截。这是最严格的一层。AI口头声称“任务完成”无效,系统会验证其实际产出的代码是否已真正写入磁盘。如果Agent声称创建了文件但实际没有,系统会捕获该错误,回滚操作并重试。
第五层,重试预算。每个任务都有独立的`max_retries`(最大重试次数)设置。超过上限后,任务将自动上报给人类处理,从根本上杜绝了因无限重试导致系统僵死的风险。

Claude Code:执行者与验收者分离,杜绝自我欺骗
Anthropic虽然是最后出手的,但其方案设计极为精巧,直指AI智能体工作的一个核心缺陷:自我评估的盲点。
本质上,Claude Code的/goal是一个会话级别的停止钩子。
你设定一个明确的完成条件(例如:“test/auth目录下所有测试用例通过且代码规范检查无错误”),Claude便会开始执行任务。

关键设计在于验收环节。每完成一轮工作后,系统不会让Claude自己判断“我是否做完了”。
相反,它会将完整的对话记录连同你设定的完成条件,一并发送给一个独立的、更轻量级的模型(默认为Haiku),由这个“裁判”模型来进行最终裁决。
如果裁判模型认为任务未完成,必须返回具体的理由(例如:“test_login.py中仍有2个测试失败”)。这个理由会被精准地注入Claude下一轮工作的上下文中,指导其进行针对性修复。
如果裁判模型判定条件已满足,目标便会自动清除,任务优雅结束。
值得一提的是,这个裁判模型不调用任何工具,不读取文件系统,也不执行命令。它仅基于Claude在对话中产生的文本内容进行判断。
因此,你设定的完成条件,必须是Claude能在对话中提供证据予以证明的内容。条件最长支持4000字符,足以进行非常细致的描述。
你甚至可以在条件中附加约束,例如“不得修改其他测试文件”、“限20轮内完成,否则停止”等,从而实现更精细化的流程控制。

决赛圈:争夺下一代开发者工作流入口
将视角拉高,我们会发现更大的图景。
Claude Code背后是Anthropic,Codex背后是OpenAI,而Hermes Agent同时接入了这两家的模型,并且也是DeepSeek V4等优秀模型的主要分发渠道之一。
这三条技术路径,恰好覆盖了当前人工智能(AI)及人工通用智能(AGI)竞争中最关键的三个生态入口。
而它们共同争夺的,其实是同一个东西:开发者工作流。
哪家的AI智能体能率先让开发者养成“设定目标即可离开,回来直接验收成果”的习惯,谁就牢牢锁定了下一代软件开发工作流的入口。
因为这种高效、自动化的工作习惯一旦形成,迁移成本将呈指数级上升。开发者不会轻易离开一个已经集成了看板调度、断点续传、检查点回滚等成熟功能的智能体基础设施。
一个看似简单的`/goal`命令,其背后关乎的是整个AI编程工作流生态的护城河建设。这场关于“任务完成度”与“交付可靠性”的竞赛,实际上才刚刚拉开序幕。
相关攻略
对于经常浏览技术社区的开发者而言,一定对这样的方案不陌生:利用Tailscale组建虚拟局域网,再配合tmux和Termius,就能在手机上流畅地远程操作家中电脑上的Claude Code。这套组合在理论上堪称完美——开源、免费,体验接近原生操作。 然而,许多实际尝试过的国内开发者都深有体会,理想与
工程师鲍里斯·切尔尼在夜间利用数千个AI智能体自动执行深度开发任务。他通过手机调度多个会话,每个会话部署多个智能体,核心依靠循环指令和例行任务实现全天候自动化。这套被他视为常规的操作引发了开发者社区的广泛关注,展现了AI从辅助工具向自主工作伙伴的演进趋势。
Anthropic旗下的命令行编程工具Claude Code今天正式上线了一项名为“Agent View”的新功能。这项处于“研究预览”阶段的交互界面,瞄准了一个很实际的痛点:当开发者需要同时处理多个并行的AI编程任务时,那些不断切换的窗口和割裂的上下文,实在太影响效率了。现在,通过一个统一的视图,
Bun宣布用六天完成的Rust版本取代原有Zig实现,涉及96万行代码,旨在解决内存泄漏与稳定性问题,尤其是作为ClaudeCode运行时的性能瓶颈。重写主要由AI完成,虽快速通过测试,但引发社区对代码质量及大量unsafe调用的担忧。此举标志Bun转向Rust,也反映AI驱动大规模代码重写的趋势。
对于开发者而言,同时管理多个Claude Code会话是否常常让你感到效率低下?频繁在多个终端标签页之间切换,在tmux面板中费力查找,还要时刻记住每个开发任务的当前进度——这种碎片化的工作体验,现在有了一个高效的解决方案。 Claude Code正式推出了全新的Agent视图功能。这项功能的核心在
热门专题
热门推荐
本文介绍了2026年主流的USDT交易软件,重点分析了币安、欧易和火币三大平台的特点与优势。内容涵盖平台安全性、交易功能、用户体验及费用结构,旨在为不同需求的用户提供选择参考。文中强调选择平台时应综合考虑资产安全、操作便捷性和交易成本,并提醒注意风险管理与合规操作。
本文介绍了USDT交易的基本概念与主流平台选择。USDT作为稳定币,其交易主要通过加密货币交易所进行。选择平台时需综合考虑安全性、流动性、手续费和用户体验。文中列举了当前市场认可度较高的几类交易平台,并提醒用户注意资产安全与合规操作,建议根据自身需求谨慎选择。
哥本哈根大学计算机科学系于2026年3月发布了一项具有里程碑意义的研究(论文编号arXiv:2603 12935v1),揭示了当前主流AI推荐系统可能潜藏的社会偏见风险。这项研究同时指出,一种高效且低成本的解决方案——提示工程,或许能成为破解这一难题的关键。 当您使用求职平台或新闻资讯应用时,背后的
照片模糊了、雨滴遮挡了画面、夜晚拍摄噪点过多……这些常见的图像质量问题,往往让人束手无策。传统的解决方案,就像请来一群专科医生:去模糊、去噪点、去雨滴,各有各的专长,但每个“医生”都需要海量的“临床经验”——动辄数百万张训练图片,才能达到可用的修复水平。 然而,一项由香港科技大学、哈尔滨工业大学深圳
这项由英属哥伦比亚大学(UBC)与Vector人工智能研究院联合主导的前沿研究,于2026年3月以预印本论文(arXiv:2603 12634v1)形式发布。研究团队创新性地提出了“预算感知价值树搜索”(Budget-Aware Value Tree Search,简称BA VT)框架,旨在攻克一个





