谷歌DeepMind发布AI安全新框架,防范模型自行关闭等风险
9月22日,谷歌DeepMind宣布对其AI安全核心文件"前沿安全框架"进行重要更新,首次将"前沿AI可能阻止人类修改或关闭系统"这一风险考虑在内。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据外媒Axios报道,最新测试显示部分新型AI模型已展现出自主制定计划以及使用欺骗手段达成目标的能力。

此次更新特别新增了"说服力"风险评估类别,用于应对可能具备改变人类信念能力的AI模型。谷歌将这类风险定义为"有害操控"——特指那些能力强大且在特定高风险场景下可能被滥用于系统性改变人们认知和行为的AI系统。
当被问及防范措施时,DeepMind代表透露:"我们建立了全新的评估体系,通过人机交互实验持续监测这类能力的演变趋势。"
DeepMind表示将保持每年至少一次的框架更新频率,以跟踪新兴威胁并进行"关键能力评级"。谷歌特别警告,"若不采取防范措施,具备这些能力的先进AI模型可能带来严重后果。"
值得注意的是,OpenAI在2024年曾推出类似的风险准备框架,但于今年早些时候移除了"说服力"这一风险分类。
相关攻略
IT之家 3 月 29 日消息,彭博社的马克 · 古尔曼在今天的《Power On》通讯中详细地讨论了苹果即将到来的人工智能计划,将于 6 月 8 日(北京时间 6 月 9 日)在全球开发者大会上揭
宇树科技具身智能体验馆亚洲首店将于5月底落地上海据“上海静安”公众号消息,3月28日,记者从2026全国精品首发季暨 “首发上海” 系列活动发布仪式上获悉,宇树科技具身智能体验馆亚洲首店,将于5月底
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
【CNMO科技消息】近日,谷歌宣布为Google TV上的Gemini助手推出三项全新功能,进一步升级家庭大屏的互动体验。此次更新聚焦于更直观的视觉回答、深度的知识探索以及便捷的体育资讯概览,旨在将
3月24日,人工智能领域迎来了一次沉重的转折。美国开放人工智能研究中心(OpenAI)在社交媒体上正式发布公告,宣布关停旗下人工智能视频生成工具Sora,这款明星产品,在历经两年的高光与挣扎后,正
热门专题
热门推荐
IT之家 3 月 30 日消息,彭博社记者马克 · 古尔曼昨天在最新一期《Power On》通讯中表示,他对苹果首款折叠屏手机 iPhone Fold 寄予厚望。他表示,这款手机将成为“iPhone
3月29日消息,Intel全新的Arrow Lake Refresh系列处理器酷睿Ultra 200S Plus已经于3月26日正式上市,包括酷睿Ultra 5 250K Plus和酷睿Ultra
企查查正式推出智能体数据平台(agent qcc com),可通过标准MCP协议对接阿里云百炼、扣子Coze、飞书集成平台等主流Agent平台。该平台针对AI Agent企业级应用面临的模型幻觉、上
【张雪机车获世界顶级赛事冠军】在3月28日进行的世界超级摩托车锦标赛(WSBK)中量级赛事(葡萄牙站)中,法国车手Valentin Debise驾驶张雪机车(编号53)820RR-RS车型,以领先近
IT之家 3 月 30 日消息,GoPro 上周(3 月 25 日)宣布将在 4 月 19 日-22 日的 NAB Show 2026 展会上发布新一代相机产品,搭载下一代 GP3 影像处理器。据介





