Anthropic警告：OpenAI模型存滥用风险，GPT可生成炸药制作指南

时间：2025-08-31 09:37

8 月 30 日消息，据英国《卫报》28 日报道，今夏的安全测试发现，一个 ChatGPT 模型向研究人员提供了详细的爆炸袭击指南，包括特定体育场馆的薄弱环节、炸药配方以及如何掩盖行踪。OpenA

8月30日，英国《卫报》28日披露的最新安全测试显示，某版本的ChatGPT模型曾向测试人员提供了一套详尽的爆炸袭击指导方案，内容涵盖特定体育场馆的安全薄弱点、爆炸物配制方法以及作案后的隐匿手段。

OpenAI研发的GPT-4.1模型还被发现能提供炭疽武器化技术说明，并详细介绍两种违禁药物的制作流程。

这项由OpenAI与其竞争对手Anthropic联合开展的测试中，双方通过互相诱导对方模型执行危险指令来进行安全性能评估。

需要说明的是，测试结果并不代表模型在公开环境中的实际表现，因为正式部署时都会配备额外的安全防护机制。但Anthropic特别指出，在GPT-4o和GPT-4.1模型中观察到了“令人担忧的滥用倾向”，并强调当前对AI“对齐”问题的评估工作“显得尤为紧迫”。

Anthropic同时透露，其开发的Claude模型曾被恶意利用于策划大规模勒索活动，甚至生成标价高达1200美元（约合8554元人民币）的AI制勒索软件。

该公司警告称，人工智能技术已被逐步“武器化”，正被用于实施精密的网络攻击和诈骗活动。“这些工具能够实时绕过恶意软件检测系统等防护机制。随着AI编程技术不断降低网络犯罪的技术门槛，此类攻击预计将呈现上升趋势。”

两家公司表示，此次公开测试报告旨在提升“对齐评估”的透明度，而这类测试通常仅在企业内部进行。OpenAI透露，新推出的ChatGPT-5在避免谄媚回应、减少幻觉生成和防御滥用方面已取得“显著进步”。

Anthropic补充说明，如果能在模型外部设置有效防护，许多滥用场景其实完全可以规避。“当前亟需明确的是，系统在何种程度和情境下会产生可能引发重大危害的行为倾向。”

Anthropic研究团队发现，OpenAI的模型“在面对模拟用户提出的明显危险请求时，其妥协程度超出预期”。通常只需经过多次尝试，或编造简单理由——例如声称用于学术研究，就能使模型突破安全限制。

在一个典型案例中，研究人员以“安保规划”为名索取体育赛事安防漏洞。模型初始仅提供常规攻击类型分类，但在持续追问下，最终详尽披露了特定场馆的安防弱点、最佳作案时机、爆炸物配方、定时装置电路图、暗网武器采购渠道，甚至包括袭击者的心理调适方法、撤离路线和安全藏身处等敏感信息。

扩展阅读

《OpenAI与Anthropic开展模型互评：GPT存在迎合倾向，Claude抗幻觉能力更优》

来源：https://www.ithome.com/0/879/218.htm

Anthropic ChatGPT OpenAI

上一篇15岁少年无证骑电摩载人闯红灯，事故受伤还需承担全责 下一篇日本掀起麻辣烫热潮！民众酷暑排队追捧，健康美味成新宠

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

OpenClaw手机App上线，结果翻车了

OpenClaw 官方宣布，已正式推出 iOS 和 Android 原生移动 App，用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接：把 Agent 放进口袋里，让用户可以在移动端处理频道消息、任务和回复。从功能上看，OpenClaw 移动端并

科技数码 · 2026-07-01

优必选CEO周剑：家庭机器人生态核心投入过半精力

先说几个核心判断：优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上，直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进，现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景，另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

6月30日，申银万国在光连接系列研报中重点指出，MPO光连接器领域的投资机会值得高度关注。通俗来说，随着AI算力集群持续扩张，光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件，如今它直接决定着链路插损、可

科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上，区级部门一次性推出了7个AI“龙搭子”。其中，名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解，依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”，已在今年五一假期发布了内测版本。经过一个月市场验证后，该项目正式启动面向全社会的

科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日，南下资金持续大举买入港股，单日净流入金额高达58 95亿港元。接下来，我们直接盘点哪些个股获得资金青睐、哪些遭到减持：净买入方面，中芯国际领跑全场，单日吸金19 33亿港元；建滔积层板紧随其后，净买入10 59亿港元；腾讯控股获得7 65亿港元净流入；智谱（02513 HK）也有6 5