首页 游戏 软件 资讯 排行榜 专题
首页
AI
开源AI模型安全风险研究:脱离限制或易遭黑客劫持

开源AI模型安全风险研究:脱离限制或易遭黑客劫持

热心网友
68
转载
2026-01-30

IT之家1月30日消息,路透社1月29日援引一项最新研究称,开源大语言模型一旦脱离主流平台的护栏与限制,在外部计算机上运行,就可能成为黑客与犯罪分子轻易劫持的目标,带来新的安全漏洞与风险。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

研究人员表示,攻击者可以直接针对运行大语言模型的主机下手,随后操控模型生成垃圾信息、编写钓鱼内容、发动虚假信息宣传,从而绕开大型平台原有的安全机制。

新研究揭示开源AI模型安全风险:若脱离限制运行或将被黑客轻易劫持

这项研究由SentinelOne与Censys两家网络安全公司历时293天联合完成,并独家提供给路透社,揭示了数千个开源大语言模型背后潜在的非法用途规模。研究人员称,风险场景涵盖黑客攻击、仇恨言论与骚扰、暴力血腥内容生成、个人数据窃取、诈骗与欺诈,甚至在个别情况下还涉及儿童性虐待材料。

研究人员指出,开源大语言模型变体数量庞大,互联网上可访问的运行实例中,相当一部分来自Meta的Llama、谷歌DeepMind的Gemma等主流模型的衍生版本。IT之家从报道中获悉,部分开源模型自带护栏,研究仍发现数百起护栏被明确移除的情况。

SentinelOne情报与安全研究执行主任Juan Andres Guerrero-Saade强调,行业对于安全控制的讨论正在“忽略一种明显存在的剩余能力”,开源算力正被用于各种用途,其中既有合法用途,也有明显的犯罪用途。Guerrero-Saade把这种现象比作一座尚未被行业与开源社区充分纳入视野的“冰山”。

研究团队重点分析了通过Ollama部署、对公众开放访问的开源大语言模型实例。Ollama是一种工具,个人或机构可在本地运行不同模型的自有版本。

研究人员在约四分之一的观察对象中能够读取系统提示词,也就是决定模型行为的核心指令。在这些可见提示词中,7.5%被判断可能会为有害行为提供支持。

全球人工智能治理中心CEO兼创始人Rachel Adams在邮件中表示,开放模型一旦发布,责任就不再只属于单一主体,而是生态系统共同承担,包括最初发布模型的实验室。实验室不可能对所有下游滥责负责,因为这些行为很难提前预料,但实验室仍负有重要的注意义务,需要预见可预见风险、记录危害,并提供缓解工具与指导,尤其是在全球执法能力不均衡的背景下。

来源:https://tech.ifeng.com/c/8qKU47VhxZj
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

罗福莉:AGI实现后,下一步将迈向“自进化”阶段
AI
罗福莉:AGI实现后,下一步将迈向“自进化”阶段

在今天举行的2026中关村论坛年会开源主题圆桌上,月之暗面创始人杨植麟和智谱CEO张鹏,小米MiMo大模型负责人罗福莉,以及无问芯穹联合创始人兼CEO夏立雪、香港大学助理教授、博士生导师、Nanob

热心网友
03.28
智谱GLM-5.1发布:所有Coding+Plan用户皆可调用
AI
智谱GLM-5.1发布:所有Coding+Plan用户皆可调用

IT之家 3 月 27 日消息,智谱最新现已公布 GLM-5 1 模型,所有 Coding Plan 用户均可调用。IT之家附 Claude Code、OpenClaw 启用 GLM-5 1 方法如

热心网友
03.28
腾讯首度披露Agent养虾全景:从基础设施到应用落地
AI
腾讯首度披露Agent养虾全景:从基础设施到应用落地

IT之家 3 月 27 日消息,腾讯云今日正式发布 Agent 产品全景图,构建了从个人到企业、从基础设施到上层场景应用的完整产品体系。该体系围绕 Agent 基础设施层、模型服务层、技能生态层、A

热心网友
03.27
智谱CEO张鹏回应涨价:长期低价竞争不利行业发展
AI
智谱CEO张鹏回应涨价:长期低价竞争不利行业发展

IT之家 3 月 27 日消息,在今日的 2026 中关村论坛年会《OpenClaw 与 AI 开源圆桌会议》上,月之暗面创始人杨植麟担任主持,并与智谱华章 CEO 张鹏、小米 MiMo 大模型负责

热心网友
03.27
雷军:斥资600亿发力AI,破解汽车行业手机厂商困局
AI
雷军:斥资600亿发力AI,破解汽车行业手机厂商困局

3月24日傍晚,小米集团发布2025年第四季度及全年业绩公告。尽管公司全年业绩再创新高,但去年第四季度却出现增收不增利的情况。财报显示,2025年,小米实现总收入4572 9亿元,同比增长25%;录

热心网友
03.27

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

揭秘中国联通:九成宽带已支持千兆,百大城市试点领先部署
网络安全
揭秘中国联通:九成宽带已支持千兆,百大城市试点领先部署

3月28日消息,中国联通近日发布2025年度业绩报告,在网络建设领域交出亮眼答卷。中国联通表示,公司持续落实信号升格、宽带升级相关举措,目前近九成宽带已具备千兆接入能力,万兆光网更在全国100多个城

热心网友
03.28
163邮箱登录指南:个人版与手机网页版入口详解
电脑教程
163邮箱登录指南:个人版与手机网页版入口详解

163邮箱个人版登录入口为https: mail 163 com,支持网页及手机浏览器直接访问,提供手机号、邮箱账号、扫码三种登录方式,界面简洁,功能齐全,适配多终端使用。163

热心网友
03.28
冒险岛:3步设置游戏键盘,社区玩家必备指南
手机教程
冒险岛:3步设置游戏键盘,社区玩家必备指南

在冒泡社区中,设置键盘能为用户带来更便捷、舒适的操作体验。以下是详细的设置方法。首先,打开冒泡社区应用程序。进入社区主界面后,找到屏幕上的设置选项。这通常可以在界面的某个角落,以一

热心网友
03.28
崩铁谎言终幕效果解析:星穹铁道光锥特效全览
游戏攻略
崩铁谎言终幕效果解析:星穹铁道光锥特效全览

一场谎言的终幕是崩坏星穹铁道中4 1版本的新光锥之一,其属性可以提高装备的暴击率,下面小编就为大家带来《崩坏:星穹铁道》一场谎言的终幕光锥效果一览,不清楚的一起来看看吧。《崩坏:星

热心网友
03.28
《白夜提灯》开播槽点全解析:男女主无CP感,演技能否逆转口碑?
娱乐
《白夜提灯》开播槽点全解析:男女主无CP感,演技能否逆转口碑?

2026年3月28日中午12时整,由腾讯视频全网独播的古装奇幻剧《白日提灯》准时上线。该剧开播前预约人数高达674万人次,被平台力推为“年度古偶扛鼎之作”,然而仅播出六小时后,口碑便急速崩塌,引发全

热心网友
03.28