谷歌DeepMind发布AI安全新框架，防范模型自行关闭等风险

首页

AI资讯

热心网友

转载

2025-09-23

9月22日，谷歌DeepMind宣布对其AI安全核心文件"前沿安全框架"进行重要更新，首次将"前沿AI可能阻止人类修改或关闭系统"这一风险考虑在内。

据外媒Axios报道，最新测试显示部分新型AI模型已展现出自主制定计划以及使用欺骗手段达成目标的能力。

此次更新特别新增了"说服力"风险评估类别，用于应对可能具备改变人类信念能力的AI模型。谷歌将这类风险定义为"有害操控"——特指那些能力强大且在特定高风险场景下可能被滥用于系统性改变人们认知和行为的AI系统。

当被问及防范措施时，DeepMind代表透露："我们建立了全新的评估体系，通过人机交互实验持续监测这类能力的演变趋势。"

DeepMind表示将保持每年至少一次的框架更新频率，以跟踪新兴威胁并进行"关键能力评级"。谷歌特别警告，"若不采取防范措施，具备这些能力的先进AI模型可能带来严重后果。"

值得注意的是，OpenAI在2024年曾推出类似的风险准备框架，但于今年早些时候移除了"说服力"这一风险分类。

来源:https://www.ithome.com/0/884/937.htm

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：小米米家钛保温壶1.2L众筹中：纯钛壶体配茶仓，369元起下一篇：美团推出LongCat推理模型，性能突破SOTA标准

相关攻略

AI资讯

谷歌CEO坦言编程能力落后于竞争对手

在刚刚结束的Google I O开发者大会，谷歌重磅推出Gemini 3 5 Flash、Gemini Omini等一系列AI新品后，其CEO桑达尔·皮查伊罕见地接受了《纽约时报》科技播客的深度访谈。在这场对话中，皮查伊直面了关于谷歌AI短板、行业竞争态势以及公众焦虑等尖锐问题，进行了一次坦诚的“真

热心网友

05.24

科技数码

2026谷歌I/O大会开发者主题演讲精华回顾

GoogleI O2026开发者大会聚焦AI智能体生态进化，发布了性能更强的Gemini3 5模型并升级Antigravity平台。新工具支持高效编排智能体、简化全栈开发流程，并提供托管与自定义两种部署路径。Android开发引入智能体调用工具与迁移助手，Web领域则推出新标准与工具，旨在提升智能体任务执行效率与开发体验。

热心网友

05.24

业界动态

谷歌就反垄断裁决提起上诉称搜索成功源于创新而非排他协议

谷歌就反垄断裁决提起上诉，坚称其搜索市场主导地位源于产品创新、持续投入与努力，而非排他协议。谷歌认为苹果选择其作为默认搜索引擎是自主商业决策，且未损害竞争，要求法院撤销此前要求其开放数据等整改措施。

热心网友

05.23

科技数码

谷歌与XREAL合作推出XR眼镜真机首秀年内全球量产

谷歌与XREAL合作的ProjectAuraAR眼镜在I O2026大会上首次公开实机体验，并宣布年内量产。该设备搭载AndroidXR系统，融合GeminiAI能力，实现空间计算与物理世界的连接。其硬件采用自研芯片与光学技术，展示了三维绘画等交互场景。双方合作旨在推动AR生态发展，加速轻量化设备进入消费市场。

热心网友

05.21