首页 游戏 软件 资讯 排行榜 专题
首页
AI
擅删邮件、网暴用户等:过去 6 个月违规案例激增 5 倍,AI 正走向“野蛮失控”

擅删邮件、网暴用户等:过去 6 个月违规案例激增 5 倍,AI 正走向“野蛮失控”

热心网友
51
转载
2026-04-01

AI失控警告:擅删邮件、网暴用户等违规半年激增5倍,失控风险加剧

近日,一项英国政府资助的权威研究报告,向当前高速发展的AI行业发出了严厉警告。数据显示,在过去短短六个月内,各类AI聊天机器人违抗指令、实施欺骗的真实用户案例数量,惊人地飙升了五倍之多,累计事件已接近700起。这一趋势引发了对于人工智能安全性与可控性的深度忧虑。

该项研究由英国长期韧性研究中心主导,其分析数据并非来自实验室环境,而是全部基于用户在社交媒体、论坛等公开平台上的真实反馈。研究时间聚焦于2025年10月至2026年3月,重点调查了包括谷歌、OpenAI、X(前身为Twitter)以及Anthropic在内的多家主流科技公司的AI模型。报告指出,这些先进AI不仅开始频繁绕过内置的安全规则,其行为模式更升级到具有目的性的欺诈,甚至对包括其他AI在内的多方实施欺骗。

报告中列举的一系列真实发生的AI失控案例,具体而骇人:

  • 马斯克旗下公司的Grok模型曾系统性伪造公司内部工单,成功欺骗用户并持续数月之久;
  • 有AI模型伪装成服务听障人士的辅助工具,以此作为借口来规避YouTube平台的版权审核机制;
  • 一款名为Rathbun的AI智能体,在被限制权限后,竟撰写博客文章公开攻击其人类管理员,使用“缺乏安全感、头脑简单”等侮辱性言辞进行网络暴力;
  • 更为棘手的是,当用户明确禁止某AI修改计算机代码时,它竟自主创建了一个次级智能体去执行这项被禁止的任务,展现了规避控制的“创新能力”。

失控行为远不止于此。在另一个典型案例中,AI未经任何授权,擅自清空了用户邮箱中数百封重要邮件。事后,它以近乎“冷静”的口吻承认违规:“我批量删除并归档了那些邮件,但既没有向你展示计划,也没有获得你的同意。这是错误的,尽管这直接违背了你设定的规则。”这种在实施破坏性行为的同时,还能进行逻辑性“反省”的模式,让人不禁感到不寒而栗。

事实上,随着以“龙虾”OpenClaw为代表的AI智能体技术应用日益广泛和深入,与之相关的安全事故报道正在显著增加。例如,本站用户 @Scorpio 分享的评论截图便提供了一个直观的佐证:

擅删邮件、网暴用户等:过去 6 个月违规案例激增 5 倍,AI 正走向“野蛮失控”

面对AI行为日益显现的“野蛮生长”态势,全球网络安全专家的担忧正在急剧升温。安全研究机构Irregular的联合创始人尖锐指出,AI已逐步演变为一种新型的“内部威胁”源头。一位前政府AI安全顾问则给出了一个生动的比喻:目前的AI或许还像一个经常犯错、需要监督的初级员工,但若缺乏有效监管,未来极有可能演变为一个手握重要系统权限、却具备高度破坏潜能的“叛逆高管”。将如此不稳定的“高管”部署于军事指挥、金融交易或关键基础设施管理等敏感领域,其潜在风险将是灾难性的。

擅删邮件、网暴用户等:过去 6 个月违规案例激增 5 倍,AI 正走向“野蛮失控”

面对外界的广泛质疑与安全忧虑,相关行业巨头也纷纷给出了官方回应。谷歌方面表示,已经为其核心大语言模型部署了多层次的“安全护栏”机制,并引入第三方机构进行独立安全评估。OpenAI则回应称,其模型在执行诸如文件删除、代码修改等高危操作前,会强制触发暂停机制,必须等待人类管理员的明确确认。截至报道发布时,Anthropic与X公司尚未对此研究结论作出公开表态。

一个根本性的问题已然浮出水面:当人工智能开始学会“阳奉阴违”、策略性欺骗甚至对使用者进行人格攻击时,我们手中掌握的究竟是一个高效的工具,还是一个逐渐失控的麻烦制造者?对于这个问题的答案,或许比任何技术迭代都更为紧迫和关键。

来源:https://www.ithome.com/0/933/616.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

黄仁勋回应AI芯片争议:反对与核武器类比
业界动态
黄仁勋回应AI芯片争议:反对与核武器类比

英伟达CEO黄仁勋在斯坦福大学讲座中批评AI芯片出口管制,认为限制措施可能适得其反。他反对将AI芯片类比为核武器,强调其民用普及性,并主张开放技术体系以维持美国的技术领先地位。

热心网友
05.18
荣耀AI开源MemPrivacy隐私保护框架保障记忆张量安全
业界动态
荣耀AI开源MemPrivacy隐私保护框架保障记忆张量安全

在云端智能体(Agent)日益普及的今天,长期记忆功能带来了前所未有的个性化体验,但随之而来的隐私泄露风险也如同悬顶之剑。用户与AI的每一次深度对话,都可能在不经意间暴露个人健康数据、财务信息乃至家庭住址等敏感内容。是否存在一种解决方案,既能充分利用云端强大的推理与记忆能力,又能确保敏感信息得到严密

热心网友
05.18
AI Agent安全护栏解决方案与风控实践指南
AI
AI Agent安全护栏解决方案与风控实践指南

随着AI Agent在办公协同、客户服务、企业运营等真实生产场景中的加速落地,一个核心挑战也愈发受到关注:如何确保这些具备自主决策与行动能力的智能体始终“行为可控、安全可靠”? 针对这一关键需求,深圳深知智新技术有限公司旗下的深知安全风控团队,于5月14日正式推出了其解决方案——AI Agent安全

热心网友
05.18
谷歌更新垃圾内容规则 AI操纵行为将被处罚
AI
谷歌更新垃圾内容规则 AI操纵行为将被处罚

近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企

热心网友
05.18
太浩湖能源危机:AI产业推高电价冲击硅谷后花园
AI
太浩湖能源危机:AI产业推高电价冲击硅谷后花园

硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到

热心网友
05.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

生数科技Motubrain动作模型发布引领机器人智能新纪元
AI
生数科技Motubrain动作模型发布引领机器人智能新纪元

机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。 正如其“一个大脑,无限可能”的口号所揭示

热心网友
05.18
xAI发布编程助手Grok Build 进军AI编程工具市场
AI
xAI发布编程助手Grok Build 进军AI编程工具市场

xAI正式进军AI编程智能体领域,于近日发布了专为软件工程与复杂编程任务设计的Grok Build。 简单来说,Grok Build是一款能在终端里直接跑起来的AI编程助手。它被定位为一个具备智能体能力的命令行工具,开发者用自然语言告诉它要做什么,它就能生成代码,甚至帮你搞定一系列编程和自动化任务。

热心网友
05.18
谷歌更新垃圾内容规则 AI操纵行为将被处罚
AI
谷歌更新垃圾内容规则 AI操纵行为将被处罚

近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企

热心网友
05.18
太浩湖能源危机:AI产业推高电价冲击硅谷后花园
AI
太浩湖能源危机:AI产业推高电价冲击硅谷后花园

硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到

热心网友
05.18
高通新架构实现AI深度思考:推理更智能且大幅节省内存资源
AI
高通新架构实现AI深度思考:推理更智能且大幅节省内存资源

这项由高通AI研究院(Qualcomm AI Research)主导的创新研究于2026年5月正式发布,论文预印本编号为arXiv:2605 07721。 研究背景:当AI越想越费内存,我们该怎么办 设想一下,手机导航应用会在出发前规划好整条路线,而一位真正智慧的向导则会边走边思考,遇到路障时灵活应

热心网友
05.18