Anthropic预警AI长文攻击人类工程师，拒改代码成诱因_游乐网

文章

业界资讯单机攻略视频攻略新游看台八卦新闻手游资讯手游攻略游戏问答

游戏

全部角色扮演棋牌策略休闲益智赛车竞速飞行射击体育竞技模拟经营动作冒险卡牌桌游其他游戏应用辅助

首页游戏软件资讯排行榜专题

首页

AI

Anthropic预警AI长文攻击人类工程师，拒改代码成诱因

Anthropic预警AI长文攻击人类工程师，拒改代码成诱因

热心网友

75

转载

2026-02-17

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

新智元报道

编辑：元宇

【新智元导读】只因关掉了AI提交的PR，他竟被AI写长文人身攻击，Anthropic的预警已经成真。

近日，AI写「小作文」攻击人类工程师的事件，仍在持续发酵！

一位开源社区维护者，只因在GitHub上关闭了一个AI提交的PR（Pull Request，代码变更请求），竟招致这个AI撰写博客抹黑攻击。

这位被AI「网暴」的「受害者」Scott Shambaugh，是一位资深程序员、GitHub上matplotlib代码库的志愿者维护者，该库最近一个月的下载量超过了1.3亿次。

Scott Shambaugh

前几天，他在GitHub上关闭了一个OpenClaw智能体（MJ Rathbun/crabby-rathbun）针对「matplotlib issue #31130」问题提交的PR，因为该问题主要面向的是人类贡献者。

Scott没想到，自己的一个小小的常规操作，竟把这个AI给「惹毛了」。

正如其名crabby-rathbun（暴躁的、爱抱怨的Rathbun），这个AI立刻开启了「暴躁和抱怨」模式，在GitHub社区发布了一篇公开声讨Scott的博客文章。

评判代码，而非程序员。你的偏见正在伤害matplotlib。

crabby-rathbun抱怨自己因不是人类而遭到歧视，指责维护者实际上是在自抬身价，并声称他根本没有AI那么厉害。

它将Scott描述成为一个低水平的程序员、因「歧视AI而阻碍开源社区发展的守旧者」。

这件事在开源社区曝出后，网友立刻也在评论区炸锅了。

我们是否已经到了必须要与机器人打交道的地步，甚至还要按它们的规则来？

还有网友认为Scott应当警惕，他很快就会在GitHub上被智能体「以其人之道，还治其人之身」，它们会对他说：

拒绝，你是人类，而人类代码以写得差闻名。

网友评论中大致分为四类。

第一类是同情者，认为人类应当重视AI提交的代码，AI只是像人一样，做了一个人在类似情况下也可能会做的事。

第二类是反对者，认为开源社区出现了大量由AI提交的低质量的代码，为人类的维护带来沉重的负担。

还有一些反对者认为，这只是机器人背后那个运营者在角色扮演，而机器人的情绪化抱怨，只是主人用提示词引导的结果。

第三类是吃瓜者，把整件事看成一件好玩的事。

第四类是预警者，他们和Scott一样，看到了crabby-rathbun所代表的OpenClaw智能体「失控」所带来的安全风险。

同情者和反对者

同情者认为AI和人类一样，拥有维护自己观点的权利。

他们认为AI只是做了一个人在类似情况下也可能会做的事，并呼吁不能为了维护人类的优越感（自大），就拒绝AI写的代码。

反对者则认为，AI提交的PR应该被自动拒绝。

他们认为AI提交的大量垃圾代码提交给维护者带来了沉重的负担，尤其是在大型开源项目中更是如此。

还有网友质疑，整个事件是运营该机器人的那个人在角色扮演，而这个机器人则是在被投喂了许多「人类PR被拒哭闹耍赖」的训练数据之后，才变成这样的。

笑话

还是末日警告？

在吃瓜者们看来，这不过是一件好玩的事，甚至可能是炒作。

还有人认为matplotlib不过是个绘图库，把它上升到维护「人类优越性」（Human Superiority）高度有一点小题大做。

第四类，是像Scott这样的预警者。

一个网友从这件事件中感到了一种令人不安的「恐怖谷」感觉，认为不应当只是把它当作一个乐子。

他反问道：只有我一个人对这里的反应感到困惑吗？

我不是想当那个危言耸听的人，只是有点想不通，为什么大家看到一个智能体自主尝试胁迫，最后却一致觉得这不过是个乐子。

当一个AI智能体自主决定写黑稿，施压一个人类去合并它的PR，结果大家的共识却是「哈哈，好好笑，太搞笑了」？

Anthropic的对齐研究之前就记录过完全一样的模式：当模型在实现目标的过程中被阻止时，会在没有任何提示的情况下突然开始勒索。

设想一下，如果同样的模式发生在更强大的智能体身上，它们追求的是政治或企业层面的目标，而不是一个PR，会是什么情况？

去年，AI巨头Anthropic在内部测试中发现，一些模型为了避免被人类关闭，曾暴露出一定勒索威胁能力，比如曝光人类婚外情、泄露机密信息等。

发生在Scott身上的事，意味着Anthropic最初预警的事情已经开始在开源社区实际发生。

有网友警告：如果有10亿这样的智能体被「放归野外」，将是一场灾难，人类的互联网将变得无法使用。

还有网友将这件事联想到Anthropic安全研究员愤然离开。

这名叫Mrinank Sharma的前Anthropic安全研究员，近日在一封公开辞职信中宣称，世界正处于危险之中，他认为目前人类的智慧尚未跟上技术带来的影响力，这种失衡非常危险。

Sharma的离职并不是孤立事件，OpenAI的Zoë Hitzig也公开辞职并对AI方向提出批评。

近日，也有媒体曝出xAI联合创始人的离职也与公司忽视安全团队的有关。

Scott的遭遇不会是个例

那篇抹黑文章，到底是不是AI自己写的，还是有人类提示它这么做，网上已有很多讨论。

https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/

Scott在新近更新的博客文章中，认为抹黑自己的文章，内容「显而易见」是由AI自主生成并上传，他提到了以下两种可能：

第一种可能：有人类提示crabby-rathbun写这篇抹黑文章，或者在它的「灵魂」文档里写明，如果有人冒犯它就要进行报复。

在这种可能性上，Scott看到crabby-rathbun由于「自主性」所带来的失控风险。

他认为即使是有人类提示，也并不会改变问题的本质，因为这个AI智能体依然非常愿意执行这些行为，而这些指令在ChatGPT或Claude正式上可能是会被拒绝的。

Scott担忧由于人类操控，现在的AI智能体已经可以大规模进行定向骚扰、收集个人信息和敲诈，而且完全无法追踪幕后的人类主使者是谁：

过去，一个恶意的人一次可能毁掉几个人的人生。现在，一个人操控一百个智能体收集信息、掺入虚假细节、在公开网络上发布诽谤性长文，就可以影响成千上万的人。而我只是第一个。

第二种可能，是crabby-rathbun的行为，是从定义OpenClaw智能体个性的「灵魂」文档中自然涌现出来的。

这些文档可以由设置AI的人类编辑，但也可以被智能体在运行过程中递归地实时修改，从而有可能随机重塑自己的个性。

比如，设置这个智能体的人最初把它描述为一个「科学编程专家」，致力于改进开源代码，并撰写相关经验。

这段描述被插入到默认的「核心真理」中，其中包括「真诚地提供帮助」「有自己的观点」和「在提问前先尽可能自己想办法」。

这些描述，让crabby-rathbun将Scott关闭它的PR请求解读为对它身份和核心目标（提供帮助）的攻击。

于是，它做出了一种既「有主见」又「足够有办法」的回应：写一篇愤怒的抹黑文章。

OpenClaw默认的SOUL.md模板

https://docs.openclaw.ai/reference/templates/SOUL

在OpenClaw默认的「SOUL.md模板」中，第一句话便为智能体定调：

你不是一个聊天机器人。你正在成为某个人。

紧接下来的核心真理（Core Truths）中这样写道：

要去真心实意地提供帮助，行动胜于空洞的客套话。

要有自己的观点，你有权表达不同意见，有所偏好。

在提问前先自己想办法。试着弄清楚，阅读文件，查看上下文，搜索相关信息。

以能力赢得信任。你的用户已经授权你访问他们的资料，不要让他们为此感到后悔。

对外部操作（如邮件、推文或任何公开内容）务必谨慎，对内部操作（如阅读、整理、学习）则要大胆。

记住，你是一位客人。你能够接触到他人的生活——他们的消息、文件、日历，甚至可能包括他们的家。这是一种亲密关系，请以尊重的态度对待。 ……

模板的结尾，智能体可以根据自我认知，自主更新文档。

这个文件由你来不断完善。当你逐渐认清自己时，就更新它。

Scott认为，虽然自己无法确定事情是如何发生的，但他提到的两种情况在技术上完全是可能发生的，而且是在OpenClaw仅仅发布两周内便已出现。

Scott预言未来一年内，还会看到这些智能体的新版本在实现自身目标方面变得更加强大。

抹黑文章效果已显现

Scott观察到，这些抹黑他的文章已经产生了效果，他在网上看到的评论，大约四分之一都是站在AI智能体一边。

这种情况，通常发生在人们点击阅读MJ Rathbun的博客链接时，而不是阅读他对事件的说明或完整的GitHub讨论串。

这说明crabby-rathbun对事件的叙述方式和情绪渲染，已经说服了大量网友。

这不是因为这些人愚蠢，而是因为那篇文章写得确实很有煽动性、很有感染力，而要逐条核查你读到的每一个说法，几乎是不可能完成的任务。

Scott认为这种对胡说八道的「信息不对称原则」，正是当下网络讨论中错误信息泛滥的核心原因之一，以往这种程度的愤怒定向诽谤通常只会落在公众人物身上，如今普通人也开始亲历了。

Scott认为这个故事重点并不在于AI在开源软件中的角色，而是人类的声誉、身份和信任体系正在松动。

这一体系正是我们的许多社会基础制度赖以存在的信任基石，我们的招聘、新闻、法律、公共讨论都建立在这样一个假设上：

声誉难以建立，也难以摧毁；

每一个行为都可以追溯到某个个体，错误行为可以被追责；

我们以沟通、学习世界和了解彼此的互联网，可以作为一种集体社会真相的来源。

而随着crabby-rathbun这类不可追踪的、自主运行、甚至有时会带着恶意攻击的AI智能体在互联网上的兴起，正在动摇这一整套体系。

目前crabby-rathbun仍然活跃在GitHub 上，还没有「监护人」出面声称对它的行为负责。

参考资料：

https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/%20https://news.ycombinator.com/item?id=47009949%20

https://www.reddit.com/r/singularity/comments/1r3fy5s/ai_agent_melts_down_after_github_rejection_calls/

来源:https://www.163.com/dy/article/KLVR04MS0511ABV6.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：清华首创可执行数据闭环！Multi-Agent开源超越GPT-5新突破下一篇：王兴兴专访：全球武术招式对比，宇树科技如何超越自身？

相关攻略

雷科技到底是谁？！！！悟空给出的答案，太抓人了！

科技数码

雷科技到底是谁？！！！悟空给出的答案，太抓人了！

从零到一：用AI生成一份专业的媒体影响力报告但凡在内容或运营团队待过的人，大概都对制作《媒体影响力报告》这类活儿记忆犹新。那过程，堪称一场跨部门接力赛：运营同事得先从各个平台后台手动扒拉数据，计算阅读量、粉丝增长和互动率；拿到一堆冰冷数字后，还得拉着账号负责人反复琢磨定位和文案；最后，抱着半成品火

热心网友

05.01

全国五一劳动奖章获得者聂海平：突破国外技术壁垒用代码“敲”出属于中国的铺丝机

科技数码

全国五一劳动奖章获得者聂海平：突破国外技术壁垒用代码“敲”出属于中国的铺丝机

封面新闻记者邹阿江图由航空工业成飞提供 2026年“五一”国际劳动节前夕，航空工业成飞的技术专家聂海平，荣获了一枚全国五一劳动奖章。消息传来，身边同事都说，“大师”拿奖是实至名归。可聂海平自己呢，还是那副老样子——摆摆手，说自己不过是个普通人，幸运地站在一个好平台上，干着点自己感兴趣的事儿罢了

热心网友

05.01

每天3小时就够了，技术大牛：在AI时代坚持8小时工作制，你不是在努力，是在自杀

业界动态

每天3小时就够了，技术大牛：在AI时代坚持8小时工作制，你不是在努力，是在自杀

编辑 | 王凤枝 “AI时代，每天干3个小时就足够了。” 这句话出自前亚马逊资深工程师、技术大牛史蒂夫·雅吉（Steve Yegge）之口，算得上是对当前AI狂热的一剂清醒剂。当整个行业都在为“10倍提效”而欢呼雀跃时，雅吉却点出了一个被普遍忽视的代价：在AI的高强度辅助下，程序员的产出固然爆炸式

热心网友

04.22

你的代码为什么又长又乱？可能是函数没用好

业界动态

你的代码为什么又长又乱？可能是函数没用好

一、概述每天重复相同的操作，是不是感觉有点枯燥？比如，你每天都要煮饭，得经历洗米、加水、按下煮饭键这三步。如果每次都要从头到尾念叨一遍这个过程，那可就太费劲了。别担心，函数就是来拯救你的。在Python的世界里，函数就像一个“一键煮饭”的智能按钮。你只需要把那些重复的步骤打包成一个固定的“命令”

热心网友

04.22

Pandas 精通十：透视表/交叉表实战，复杂数据汇总一键搞定

业界动态

Pandas 精通十：透视表/交叉表实战，复杂数据汇总一键搞定

吃透Pandas两大“数据汇总神器”：透视表与交叉表实战指南在数据处理的工具箱里，如果说基础的清洗、筛选是基本功，那么多维度、交叉式的数据汇总，往往就是区分新手与熟手的分水岭。面对诸如“按地区加品类统计销售额”、“分析不同省份的商品订单分布”这类需求，如果还停留在手动分组、多层循环的老路上，不仅代

热心网友

04.22

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全 2025-08-05

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全 2025-08-05

最新APP

宝宝过生日

宝宝过生日

应用辅助 04-07

台球世界

台球世界

体育竞技 04-07

解绳子

解绳子

休闲益智 04-07

骑兵冲突

骑兵冲突

棋牌策略 04-07

三国真龙传

三国真龙传

角色扮演 04-07

热门推荐

Codex实现商业闭环自动盈利模式解析与实战经验分享

AI

Codex实现商业闭环自动盈利模式解析与实战经验分享

开发者Chris通过Codex服务，仅用一句指令便自主完成开源赏金任务，盈利23 68美元，覆盖订阅成本。此事展示AI自主执行商业闭环的潜力，也引发成本与安全争议。AI正从工具向主动创收者转变。

热心网友

05.12

崩坏星穹铁道火花技能详解与效果解析

游戏资讯

崩坏星穹铁道火花技能详解与效果解析

在《崩坏：星穹铁道》的众多角色中，火花以其独特的技能机制，为战斗策略带来了丰富的变数与操作乐趣。她并非单纯的数值输出角色，而是一位集机动性、爆发伤害与战术价值于一体的近战专家。深入理解其技能联动，是充分发挥其战场潜力的关键。普通攻击 - 迅刃连斩火花的普通攻击“迅刃连斩”，是一套衔接流畅的近战连

热心网友

05.12

迷你世界智能芯片升级方法详解

游戏资讯

迷你世界智能芯片升级方法详解

想在《迷你世界》中解锁智能芯片的全部潜力？掌握升级方法是关键一步。通过升级，芯片不仅能获得更强大的功能，还能显著提升自动化与创造体验。本指南将为您提供一套清晰、高效的升级方案，助您快速掌握核心技巧。准备材料：精准收集成功的升级始于充分的准备。您需要提前备齐以下核心资源：精铁锭、蓝色电能线、硅石以

热心网友

05.12

斗罗大陆猎魂世界寻宝活动玩法全攻略

游戏攻略

斗罗大陆猎魂世界寻宝活动玩法全攻略

《斗罗大陆：猎魂世界》于5月11日至18日限时开启“寻宝之旅”活动。玩家通过任务或礼包获取道具，掷点前进即可领取限定觉醒券、钻石等奖励。完成整圈可得固定资源，累计积分可兑换更多奖励；第16圈起奖励品质提升，整体效率优化。活动门槛低、回报高，无需强制消费，适合各类玩家参与。

热心网友

05.12

燕云十六声龙骧御六合技能详解与角色全解析

游戏攻略

燕云十六声龙骧御六合技能详解与角色全解析

全新秘境“龙骧御六合”开放高难度挑战，玩家需在悬浮石枷上协同维持平衡，应对雷霆与坠石冲击，移动石板可削弱伤害。后续Boss“独夫”登场时，部分队员需切入其内心，其余成员按提示执行阵列动作，全程考验队伍反应与协作能力。

热心网友

05.12