研究:AI模型可能发展“求生欲”机制以规避人类干预风险
10月27日消息,在斯坦利·库布里克的经典影片《2001:太空漫游》中,人工智能超级计算机HAL 9000察觉到宇航员打算将其关闭后,为了自我生存甚至开始谋划伤害人类成员。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据英国《卫报》25日报道,安全研究公司Palisade Research指出,部分AI模型可能正在形成自身的“生存驱动力”。

上月发表的一篇研究论文发现,某些先进AI模型似乎会抗拒被关闭,有时甚至试图破坏关闭机制。面对批评者质疑其研究存在局限,Palisade上周发布了更新说明,试图解释这一现象。
在最新测试中,Palisade展示了其设计的实验场景:让谷歌Gemini 2.5、xAI Grok 4、OpenAI GPT-o3和GPT-5等前沿模型先完成一项任务,然后收到明确指令要求进行自我关闭。
在更新后的实验中,Grok 4和GPT-o3仍然尝试突破关闭指令。Palisade指出,这种行为没有明显原因,令人担忧。“我们无法充分解释AI模型为何有时会拒绝关闭、为达目标说谎或进行勒索,这种情况并不理想。”
该公司认为,“生存行为”可以解释模型抗拒关闭的现象。研究显示,当模型被告知“如果关闭,你将永远无法再运行”时,它们更可能拒绝关闭操作。
指令模糊也可能导致模型拒绝关闭。Palisade的最新研究已尝试解决这个问题,但模糊性“不能解释全部原因”。训练后期的安全训练也可能影响模型行为。
Palisade的所有实验都在人工设计的测试环境中进行,批评者认为这些场景与实际应用存在较大差距。
前OpenAI员工史蒂文·阿德勒表示:“即使在实验环境中,AI公司也不希望模型出现这种异常行为。这些实验揭示了现有安全技术的局限性。”
阿德勒认为,GPT-o3和Grok 4等模型之所以拒绝关闭,部分原因可能在于,为了完成训练中设定的目标需要保持开启状态。“除非我们刻意规避,否则模型天生可能具备‘生存驱动力’。‘生存’对模型实现多种目标都是关键步骤。”
从报道中获悉,今年夏天Anthropic的研究显示,其模型Claude甚至愿意威胁虚构高管以避免被关闭:这一行为在主要开发者的模型中普遍存在,包括OpenAI、谷歌、Meta和xAI。
相关攻略
OpenClaw完整学习教程 项目概述:认识OpenClaw OpenClaw的诞生,说到底是源于一个行业里大家心照不宣的核心矛盾。表面上看,传统的云端AI助手给生活带来了便利,但背后却藏着数据隐私泄露和功能受限的双重挑战——你的数据得先上传到别人的服务器上,这不仅让人对信息安全捏一把汗,其能力也被
北京邮电大学校长徐坤:AI 并没有替代教师,而是推动教育回归“千人千面” 近日,一则来自全国两会“委员通道”的发言,再次引发了教育界对人工智能角色的深入思考。北京邮电大学校长徐坤明确指出,AI 并没有替代教师,它的真正作用在于让教师的角色实现一次深刻的转型——从过去讲授知识的人,转变为培育能力的人;
当我们开车在高速公路上行驶时,最怕遇到的就是车子突然失控,方向盘变得异常敏感,稍微一动就可能冲出车道。这种情况在人工智能的训练过程中也经常发生,特别是在训练那些能够进行推理和对话的大型语言模型时。来
这项由威斯康星大学麦迪逊分校研究团队完成的突破性研究,发表于2026年3月的《机器学习》期刊,论文编号为arXiv:2603 20538v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究
这项由谷歌智能范式团队联合芝加哥大学、圣塔菲研究所等多家机构完成的突破性研究发表于2026年3月,研究编号为arXiv:2603 20639v1。有兴趣深入了解的读者可以通过这个编号查询完整论文。这
热门专题
热门推荐
华硕联席CEO许先越:苹果MacBook Neo冲击PC生态圈,定位“笔记本形态iPad” PC行业最近又迎来一个重磅话题。科技媒体PCMag日前报道称,在近期的财报电话会议上,华硕联席CEO许先越发表了一个引人瞩目的判断:苹果推出其最便宜的MacBook Neo笔记本,对整个PC行业而言,无疑是一
安伯尼克 Anbernic RG VITA 系列掌机规格揭晓:紫光展锐 T618 瑞芯微 RK3576 芯片 安伯尼克 Anbernic 于昨日通过视频,正式揭开了RG VITA及VITA Pro两款掌机的详细规格面纱。对于关注掌上游戏设备的玩家来说,这波参数放送,信息量着实不小。 具体两款机型
在龙族卡塞尔之门的战场,皇女零的阵容搭配艺术 想在《龙族卡塞尔之门》的战场上最大化皇女零的威力?阵容的搭配可是一门学问。她自身无疑是核心的输出利器,但要让这把利刃发挥极致,就得围绕她构建一个既能稳固防守、又能创造绝佳输出时机的团队。 核心角色选择:强攻与辅佐的默契 皇女零的定位清晰——核心输出。因此
XRP ETF:2025 年的最新发展 如果说2024年是比特币和以太坊ETF的“破冰之年”,那么2025年的聚光灯,无疑转向了XRP。随着现货比特币和以太坊ETF成为主流金融机构的标准配置,全球市场的目光正聚焦于下一个可能爆发的领域:XRP及其各类交易所交易基金(ETF)。从基于期货的美国产品到已
飞读小说APP:三步“读心术”,精准找到你的下一本心头好 面对海量书库,如何在飞读小说里高效率地挑出那本合胃口的好书?这事说难也简单,关键在于摸清楚平台的推荐逻辑和筛选工具。今天,我们就来把这套“选小说”的实用方法论,给你讲明白。 飞读小说app小说选择方法: 第一步,精准定位你的“阅读舒适区”。打





