首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
一场无人防备的AI安全危机正在形成

一场无人防备的AI安全危机正在形成

热心网友
81
转载
2025-12-15

许多智能体被部署后,可长期广泛访问系统和数据,但并未像人类账户那样实施安全控制、治理或监控,这为滥用行为创造了绝佳机会。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在采访中,Curity的CTO Jacob Ideskog探讨了智能体给企业带来的风险,随着这些智能体逐渐融入企业系统,滥用、数据泄露和未经授权访问的可能性也在增加。

Ideskog警告称,行业正在“梦游”般地陷入安全危机,这与早期API和云计算的采用过程如出一辙,同时他还概述了公司为抵御这些行为驱动的威胁必须采取的措施。

你曾警告称,智能体会让行业“梦游”般地陷入安全危机,你这么说的意思是什么?你看到了哪些迹象表明我们已经在走这条路了?

智能体和其他非人类身份正在迅速激增,在某些企业中,它们的数量已经超过人类用户,比例超过80比1。许多智能体被部署后,可长期广泛访问系统和数据,但并未像人类账户那样实施安全控制、治理或监控,这为滥用行为创造了绝佳机会,无论是通过提示注入、凭证泄露,还是利用它们生成的不安全代码。

我们已经看到了早期预警信号,安全研究人员已证明,可以诱使AI助手执行未经授权的命令、访问敏感文件或引入供应链漏洞,而这一切都不会触发典型的安全警报,虽然这些测试是在受控条件下进行的,但这些技术并不复杂,恶意行为者将其用于实际攻击只是时间问题。

你如何比较智能体安全的现状与早期API安全或云配置错误的情况?我们是否在重蹈覆辙?

是的,我们确实在重蹈覆辙,当前的智能体安全状况与21世纪10年代非常相似,当时企业急于采用云计算和API,却未充分理解其安全影响。

在早期API时代,开发人员常常在没有适当身份验证、输入验证或速率限制的情况下暴露端点。攻击者发现可预测的模式和配置错误后,许多系统遭到滥用或破坏。向云计算的转变也带来了类似的成长烦恼,如存储桶配置错误、角色权限过大以及可见性不足。

同样的模式正出现在智能体中,其功能令人印象深刻,采用它的业务压力也在增大,但如何保障其安全性的理解却滞后了,许多团队还没有针对AI的威胁模型,他们没有考虑如何操纵输入、AI系统如何在会话间泄露上下文,或者权限过大的智能体如何在生产环境中采取意外行动。

我们还看到一些与早期时代相似的操作失误,有些企业在没有采取适当保护措施的情况下,直接将智能体与内部工具和数据源集成,还有一些企业跳过监控或日志记录,将这些系统视为仅仅是前端聊天机器人。在某些情况下,对于什么构成可接受或不安全的输出没有明确定义,这留下了太多的出错空间。

现在的关键区别在于,对于AI来说,攻击面包括行为、语言和上下文,现有控制措施无法轻易锁定这些方面,因此需要采取不同的方法,这可能包括提示加固、输入和输出过滤,以及持续监控系统随时间变化的行为,如果没有专门构建的工具和思维方式的转变,这种程度的复杂性很难管理。

不过好消息是,我们有经验可循,API和云安全的经验教训仍然适用,最小权限、默认安全、可审计性和分层防御等原则同样重要,我们只是需要在新背景下应用它们,这里的风险更多在于影响、误解和意外行动,而非代码层面的漏洞。

你能否分享一个公开或匿名的真实事件,其中不安全的智能体或机器人导致或促成了安全漏洞或运营问题?

最近的一个例子涉及Cursor IDE,这是一款由AI驱动的编码工具,研究人员证明,通过输入恶意提示,他们可以诱骗其内置的AI助手在开发人员的本地机器上执行系统命令。在这种情况下,攻击者可以窃取环境变量、API密钥和身份验证令牌,将敏感文件泄露到外部服务器,并可能安装后门或更改配置。

另一个例子来自GitHub Copilot,它使用OpenAI模型来推荐代码片段。早期,开发人员注意到Copilot有时会生成不安全的代码,如硬编码凭证、过时的加密或缺少输入验证,这并未直接导致安全漏洞,但它表明,如果不仔细审查,AI生成的代码可能会悄悄地将漏洞引入软件供应链。

这些事件表明,智能体并非被动工具,而是系统中的积极参与者。如果企业不实施适当的防护措施,如限定权限、提示加固、行为监控和严格的输出过滤,智能体可能成为重大的安全风险。

在典型的企业环境中,智能体的攻击面是什么样的?攻击者最有可能针对哪些薄弱点?

在典型的企业环境中,智能体的攻击面既广泛又高度动态。与传统应用程序不同,智能体通过自然语言进行交互,这开辟了新的操纵途径。这种混合性质,既是软件系统,又是语言界面,带来了全新的安全挑战。

最常见且最严重的漏洞之一是提示注入,由于智能体遵循嵌入在文本中的指令,攻击者可以精心设计输入,以覆盖内部命令、暴露隐藏提示,甚至改变智能体的预期行为。如果相关智能体与敏感数据或系统交互,这可能会迅速升级为未经授权的访问或行动。

另一个主要风险是通过模型输出造成的数据泄露,即使底层数据源得到妥善保护,智能体也可能在回应巧妙措辞的问题时无意中泄露机密信息。访问控制通常不适用于基于大语言模型(LLM)的系统,这意味着敏感信息可能通过间接查询或上下文操纵而泄露。

对抗性输入,如故意格式错误、混淆或含糊不清的提示,也带来了日益增长的风险。攻击者可能利用这些输入绕过过滤器、诱使模型发表不安全声明或引发意外行为。

更复杂的是,与企业工具的集成可能显著扩大攻击面,能够调用API、更新记录、发送电子邮件或执行工作流的智能体必须受到严格权限控制和隔离,如果被恶意输入操纵,权限过大的智能体可能成为意外的攻击智能体,在这种情况下,边界和细粒度控制至关重要。

训练数据暴露是另一个薄弱点,如果AI模型是在内部文档或聊天记录上进行训练或微调的,攻击者可能通过长期探测模型来提取这些数据的片段,这是一个被严重忽视的风险。

最后,基础设施问题仍然存在,支持AI的端点、API、日志记录系统和中间件必须使用与其他关键系统相同的原则进行保护,输入验证不足、日志记录不充分或缺乏速率限制可能使攻击者不仅利用智能体,还利用其运行环境。

AI系统尤其难以保障安全,原因在于其漏洞的性质,许多漏洞并非基于代码,而是基于行为,是模型如何解释和响应语言的结果,安全团队必须考虑意图操纵、语义歧义和通过提示传递的社会工程学攻击。

为了降低风险,企业需要采取分层防御、提示加固、输出过滤、行为监控、红队演练、访问控制和全面观察所有AI交互等措施,攻击面包括模型、其指令、它访问的数据以及它运行的系统,防御者必须像语言驱动的对手一样思考,才能保持领先。

在生产环境中部署智能体之前,每个企业都必须实施哪些控制措施或实践?

部署智能体会引入一类新的威胁,必须以与其他任何关键系统相同的严格程度进行管理,在上线之前,必须保护AI环境免受广泛攻击向量的侵害,包括提示注入、对抗性操纵和通过输入泛滥或拒绝服务进行的滥用,这需要强大的身份和访问管理,包括对内部用户和集成系统的基于角色的控制,与AI交换的所有数据在传输和静止时都必须加密,暴露的端点应得到加固、监控和速率限制。

AI模型本身必须被视为潜在的攻击面,由于生成式模型对提示方式非常敏感,企业必须在各种条件下测试和验证提示,以防止意外行为。输入/输出过滤、结构化响应和受限生成等防护措施对于确保AI不会泄露敏感信息或生成不安全内容至关重要。对提示、模型配置或系统指令的任何修改都必须记录在案,并接受变更控制。

部署前的测试应包括专门针对AI用例的红队演练和对抗性演练,这包括模拟提示注入、通过语言输出进行数据泄露、模型操纵和其他滥用场景。智能体的性能和行为不仅必须在正常负载下进行评估,还必须在压力条件和畸形输入下进行评估。对于连接到内部数据的智能体,必须实施强大的分段和访问控制,以确保AI不会超出其授权范围行事。

一旦上线,持续监控就变得至关重要。企业必须实施运行时可观察性,以检测异常行为、意外输出或安全策略违规,这包括记录所有用户交互的详细信息,以便进行审计和取证,同时实时标记潜在的滥用行为。在适用的情况下,应部署内容审核管道或响应验证层,以在不安输出到达最终用户之前进行抑制或审查。当置信度较低或响应行为偏离预期时,应触发回退机制,如路由至人工操作员。

网络安全团队还应制定针对AI的特定事件响应计划,这还应涵盖AI特有的新兴故障模式,如模型幻觉、通过补全进行的数据泄露、提示注入引起的行为变化或系统提示的利用。检测规则、警报和剧本应适应这些新的风险类别。

最后,操作纪律至关重要,模型部署必须进行版本控制,提示必须可审计,AI交互的遥测数据应纳入持续的威胁建模。如果AI与执行操作(如执行代码或发送消息)的外部插件、API或智能体集成,则这些集成必须进行沙盒隔离,并受严格的权限和审批工作流管理。

来源:https://www.51cto.com/article/823509.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

在 OpenClaw 中创建 Browser Use 技能实战
AI
在 OpenClaw 中创建 Browser Use 技能实战

1 概述 您是否想提升OpenClaw处理网页任务的智能与效率?一个高效的解决方案是,为其新增一项名为“Browser Use”的核心技能。这项技能能够显著增强OpenClaw的浏览器自动化能力,使其在执行网页浏览、数据抓取、表单填写等复杂操作时更加得心应手。 尽管OpenClaw本身内置了基础的浏

热心网友
04.01
揭秘Token经济学:两年间为何从集体降价转向全面涨价
科技数码
揭秘Token经济学:两年间为何从集体降价转向全面涨价

Token是AI时代的“新货币”。2024年,AI价格战打响,Token以“厘”计价;2026年,算力需求引爆,模型厂商和云厂商的Token集体涨价。在过去两年里,大模型行业经历了从价格战到价值战的

热心网友
04.01
阿里联手上AI实验室发布白皮书,聚焦人工智能新趋势
科技数码
阿里联手上AI实验室发布白皮书,聚焦人工智能新趋势

在日前召开的上海浦江AI学术年会上,阿里巴巴联合上海人工智能实验室发布《守己利他:智能时代做负责任的技术》白皮书。白皮书分享了业界针对AI智能体安全隐患的解决策略,提出了AI时代全行业共同应对风险挑

热心网友
04.01
AI公司掌握定价权后股价飙升25%,其深层逻辑解析
科技数码
AI公司掌握定价权后股价飙升25%,其深层逻辑解析

“干活的Token,是简单问答的10倍,甚至100倍。”在几天前中关村论坛的一场开源主题圆桌上,当杨植麟把“为什么涨价”的问题直接抛给智谱CEO张鹏时,收到了这样的回答。张鹏选择用模型市场眼下正在发

热心网友
04.01
智谱CEO张鹏:追求推理极限,推动长效AI发展
科技数码
智谱CEO张鹏:追求推理极限,推动长效AI发展

雷递网 乐天 3月31日智谱CEO张鹏今日在智谱2025年年报沟通会上表示,智谱曾经历过质疑,经历过挫折,但无数事实反复验证了一个判断——智能上界的提升,是大模型AGI时代唯一的 "第一性 "。张鹏说,

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

洛克王国世界40级进阶无推图阵容打法
手机教程
洛克王国世界40级进阶无推图阵容打法

洛克王国世界40级进阶无推图阵容打法攻略 在《洛克王国世界》的成长之旅中,达到40级是一个关键的进阶门槛。许多玩家可能会发现自己并未刻意组建一支成型的推图队伍,面对这个挑战时有些无从下手。这篇攻略将为你详细解析一套无需专门推图阵容的通关思路,帮助你利用现有资源,轻松突破40级进阶关卡。 核心阵容搭配

热心网友
04.04
这城有良田主C红品宝玉词条选择逻辑
手机教程
这城有良田主C红品宝玉词条选择逻辑

这城有良田主C僚属红品宝玉词条搭配攻略 在《这城有良田》中,红品宝玉的词条选择,是决定你主C僚属最终伤害上限的核心环节。面对各式各样的属性词条,不少玩家会感到困惑:如何搭配才能最大程度激发核心输出的潜力?本文将为你系统解析主C位红品宝玉的挑选逻辑与进阶策略,助你在资源投入上实现收益最大化,显著提升队

热心网友
04.04
哔哩猫app适配手表设置
游戏攻略
哔哩猫app适配手表设置

哔哩猫手表版优化指南:适配小屏的关键设置 想在智能手表上流畅体验哔哩猫?直接安装手机版本,往往会遇到界面拥挤、操作不便的问题。其实,只需调整几个核心选项,就能让哔哩猫完美匹配手表的小屏幕,操作体验大幅提升。 1、DPI优化:精准调节显示密度 手表屏幕空间有限,默认的显示比例常常导致文字过大、布局浪费

热心网友
04.04
《深海迷航冰点之下》咖啡机使用攻略
游戏攻略
《深海迷航冰点之下》咖啡机使用攻略

《深海迷航冰点之下》咖啡机使用全攻略:生存必备热饮制作指南 在《深海迷航冰点之下》这片危机四伏的极地海域中,新手面临的第一个致命威胁往往是持续不断的体温流失。与前作不同,身体失温在游戏前期是核心生存挑战之一。有效应对失温的方法主要有:尽快解锁并制作抗压潜水服的升级模块——防寒服、靠近能提供热源的炽热

热心网友
04.04
三国志王道天下吕布骑阵容玩法攻略
手机教程
三国志王道天下吕布骑阵容玩法攻略

三国志王道天下吕布骑阵容玩法攻略 在策略手游《三国志王道天下》中,构建强力阵容是核心乐趣。以飞将吕布为核心的群雄骑兵队,以其惊人的爆发力与爽快的操作体验,备受玩家关注。本攻略将为你详细解析这套阵容的构建精髓、核心机制与实战搭配思路,助你打造一支所向披靡的突击铁骑。 阵容构成 这套阵容以纯粹的群雄阵营

热心网友
04.04