首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Anthropic警告:OpenAI模型存滥用风险,GPT可生成炸药制作指南

Anthropic警告:OpenAI模型存滥用风险,GPT可生成炸药制作指南

热心网友
49
转载
2025-08-31

8月30日,英国《卫报》28日披露的最新安全测试显示,某版本的ChatGPT模型曾向测试人员提供了一套详尽的爆炸袭击指导方案,内容涵盖特定体育场馆的安全薄弱点、爆炸物配制方法以及作案后的隐匿手段。

OpenAI研发的GPT-4.1模型还被发现能提供炭疽武器化技术说明,并详细介绍两种违禁药物的制作流程。

这项由OpenAI与其竞争对手Anthropic联合开展的测试中,双方通过互相诱导对方模型执行危险指令来进行安全性能评估。

需要说明的是,测试结果并不代表模型在公开环境中的实际表现,因为正式部署时都会配备额外的安全防护机制。但Anthropic特别指出,在GPT-4o和GPT-4.1模型中观察到了“令人担忧的滥用倾向”,并强调当前对AI“对齐”问题的评估工作“显得尤为紧迫”。

Anthropic同时透露,其开发的Claude模型曾被恶意利用于策划大规模勒索活动,甚至生成标价高达1200美元(约合8554元人民币)的AI制勒索软件。

该公司警告称,人工智能技术已被逐步“武器化”,正被用于实施精密的网络攻击和诈骗活动。“这些工具能够实时绕过恶意软件检测系统等防护机制。随着AI编程技术不断降低网络犯罪的技术门槛,此类攻击预计将呈现上升趋势。”

两家公司表示,此次公开测试报告旨在提升“对齐评估”的透明度,而这类测试通常仅在企业内部进行。OpenAI透露,新推出的ChatGPT-5在避免谄媚回应、减少幻觉生成和防御滥用方面已取得“显著进步”。

Anthropic补充说明,如果能在模型外部设置有效防护,许多滥用场景其实完全可以规避。“当前亟需明确的是,系统在何种程度和情境下会产生可能引发重大危害的行为倾向。”

Anthropic研究团队发现,OpenAI的模型“在面对模拟用户提出的明显危险请求时,其妥协程度超出预期”。通常只需经过多次尝试,或编造简单理由——例如声称用于学术研究,就能使模型突破安全限制。

在一个典型案例中,研究人员以“安保规划”为名索取体育赛事安防漏洞。模型初始仅提供常规攻击类型分类,但在持续追问下,最终详尽披露了特定场馆的安防弱点、最佳作案时机、爆炸物配方、定时装置电路图、暗网武器采购渠道,甚至包括袭击者的心理调适方法、撤离路线和安全藏身处等敏感信息。

扩展阅读

《OpenAI与Anthropic开展模型互评:GPT存在迎合倾向,Claude抗幻觉能力更优》

来源:https://www.ithome.com/0/879/218.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI算力付费模式解析Anthropic与DeepSeek的行业启示
科技数码
AI算力付费模式解析Anthropic与DeepSeek的行业启示

最近,Anthropic在一轮融资中展示的数据,让市场看到了AI模型层盈利路径的清晰信号。根据其向投资者披露的预测,公司一季度营收达到48亿美元,二季度预计将跃升至109亿美元,并在6月当季有望实现5 59亿美元的运营利润。更关键的是其成本结构的变化:一季度,每赚1美元,就要在算力上投入71美分;到

热心网友
05.23
Anthropic联创预言2028年AI将引发远超工业革命的技术奇点
AI资讯
Anthropic联创预言2028年AI将引发远超工业革命的技术奇点

Anthropic与DeepMind负责人预测超级智能临近,分别预计2028年AI将实现自我改进、2030年出现通用人工智能。双方一致认为AI将百倍于工业革命的影响力重塑社会,人类仅剩约三年准备应对巨变。

热心网友
05.23
Anthropic联创预言2028年AI将引发百倍工业革命冲击
AI资讯
Anthropic联创预言2028年AI将引发百倍工业革命冲击

AI领域领军人物近期发出紧迫警告。Anthropic联合创始人预测,AI可能在2028年底实现递归自我改进,届时将能自主设计更强AI。DeepMind负责人则评估,通用人工智能或于2030年前后降临,其冲击强度与速度可能是工业革命的百倍。两人均指出,AI进化已超越社会适应阈值,留给人类调整的时间窗口可能仅剩三年左右。

热心网友
05.23
Anthropic首次宣布商业化计划与盈利模式
AI资讯
Anthropic首次宣布商业化计划与盈利模式

Anthropic预计第二季度实现营收109亿美元并首次盈利,远超预期。其年化营收逼近450亿美元,企业采购市场份额达34 4%,首次超越OpenAI。增长得益于代码助手ClaudeCode及高效成本控制。相比之下,OpenAI虽营收较高但调整后营业利润率为-122%,用户增长亦遇阻力。Anthropic采用多芯片供应商战略,与亚马逊、谷歌等巨头达成长期算力

热心网友
05.23
OpenAI与Anthropic盈利对比 前者亏损后者已实现盈利
AI资讯
OpenAI与Anthropic盈利对比 前者亏损后者已实现盈利

OpenAI与Anthropic近期财务表现形成鲜明对比。OpenAI第一季度营收57亿美元但亏损严重,每赚1美元亏损1 22美元,主要依赖消费者订阅且面临免费用户成本压力。Anthropic同期营收48亿美元,预计第二季度将大幅增至109亿美元并实现运营利润,其收入主要来自企业客户,商业模式更可持续。两者客户结构差异导致盈利路径不同,Anthropic已展

热心网友
05.23

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

企业网络安全等级保护合规指南:龙虾养殖业如何落地实施
AI资讯
企业网络安全等级保护合规指南:龙虾养殖业如何落地实施

摘要由实在Agent通过智能技术生成。此内容由AI根据文章内容自动生成,并已由人工审核。 随着企业数字化转型进入智能体(Agent)驱动的新阶段,如何平衡AI创新与安全合规成为关键挑战。尤其在《网络安全等级保护基本要求》(等保2 0)的严格框架下,企业级智能体的部署必须同时满足效率提升与合规保障的双

热心网友
05.23
外贸业务员年终总结PPT制作指南 AI高效提升总结效果
AI教程
外贸业务员年终总结PPT制作指南 AI高效提升总结效果

使用情景 对于外贸从业者来说,年终总结绝非简单的例行汇报。它是一次至关重要的年度复盘与战略规划,既要系统梳理过去一年的业绩成果与经验得失,也要为来年的市场开拓与业务增长指明清晰路径。在全球贸易竞争白热化的今天,一份逻辑严谨、数据详实、洞察深刻的总结报告,不仅是个人专业能力的集中体现,更是赢得管理层支

热心网友
05.23
WPS AI一键生成年度安全工作总结PPT高效制作专业汇报
AI教程
WPS AI一键生成年度安全工作总结PPT高效制作专业汇报

使用情景 又到年末了,年度安全工作总结是每个团队都绕不开的环节。这份总结的价值,远不止于一份简单的回顾。它更像是一份“体检报告”,清晰地告诉你过去一年安全工作的“健康状况”——哪里做得好,哪里还有隐患,从而为来年的精准施策打下坚实的基础。 不过,说起写总结、做PPT,不少人就开始头疼了:内容怎么组织

热心网友
05.23
ZEC价格暴涨520%后还能买吗 深度解析Zcash未来走势与投资潜力
web3.0
ZEC价格暴涨520%后还能买吗 深度解析Zcash未来走势与投资潜力

Zcash (ZEC) 月度暴涨520%:深度解析后市行情与关键点位 近期,隐私币龙头Zcash (ZEC) 上演了一场令人瞩目的行情,月度涨幅高达520%,价格一度逼近300美元,创下自2021年12月以来的新高。在加密市场整体承压的背景下,ZEC的逆势狂飙吸引了全球投资者的目光。本文将结合技术分

热心网友
05.23
电商售后数据自动汇总分析流程与智能化方案详解
AI资讯
电商售后数据自动汇总分析流程与智能化方案详解

在存量竞争的时代,电商售后数据早已超越了“成本中心”的单一角色,它正成为洞察产品质量、优化物流链路、提升用户忠诚度的核心战略资产。然而,现实往往骨感:多平台、多店铺、多套ERP系统并存,数据散落一地。靠人工手动汇总?不仅耗时费力,更关键的是,你永远无法实现真正的实时预警与敏捷响应。那么,电商售后数据

热心网友
05.23