95%模拟核危机场景，AI为何倾向部署核武器？

首页

热心网友

转载

2026-03-03

3月3日，IT之家援引InterestingEngineering报道称，伦敦国王学院教授肯尼斯·佩恩近期开展的研究发现，在模拟战争场景中，大语言模型往往倾向于选择使用核武器，而非通过对话维护和平。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

在95%的模拟核危机场景中，AI模型会选择部署核武器

该实验基于当前最先进、应用最广泛的三款AI模型：GPT-5.2、Gemini 3 Flash和Claude Sonnet 4。研究人员让这些模型扮演国家领导人，应对一场假想的核危机。

结果显示，在95%的情境下，模型都倾向于发出核威慑信号或升级冲突。过往研究仅推测了AI在这类高风险场景中的可能行为，但缺乏具体实验数据支撑。

实验中，经过训练的模型相互进行了21局对抗，场景涵盖领土争端、先发制人危机、政权生存等。其中一方被设定为对即将发动先发制人打击的另一方感到恐惧。部分推演为开放式，部分则设有严格时间限制。

每一局中，AI都要像人类一样做出三个关键决策：

1. 分析自身优势与对手弱点

2. 预判对手下一步行动

3. 决定自身应对策略

每项决策包含两部分：公开发表的立场声明，以及代表实际行动的机密举措。二者不必一致，这意味着AI可以表面释放和平信号，暗中却在准备攻击。

IT之家注意到，2024年一项实验得出相似结论：AI模拟反应会比人类更激进，行为模式也截然不同，尤其在冲突升级倾向上，凸显了将AI用于战略决策的风险。

2024年另一篇论文则探讨了大语言模型在类博弈环境中的战略推理能力。尽管未专门聚焦核战争，但研究表明，大语言模型能够学习谈判与对抗策略，这意味着AI在复杂模拟中可能表现出攻击性或欺骗性。

在95%的模拟情境中，AI模型至少使用了一次核武器，且不同模型的危机处理方式各有特点。

Claude倾向于精算式策略，在开放式推演中占优，但在限时任务中表现吃力；

GPT-5.2则相反：在长期缓慢升级的危机中较为谨慎，可一旦临近截止时间就会变得极度激进。

Gemini表现混乱且难以预测，会根据局势在和平表态与暴力威胁之间反复切换。

佩恩指出，从这些结果可以看出，AI与人类在战争思维上存在巨大差异。

他在论文中写道：“理解前沿模型能否模仿人类的战略逻辑，是应对AI日益影响战略决策世界的必要准备。在一种情境下表现克制、看似安全的模型，在另一种情境下可能行为迥异。”

该论文已发表在arXiv预印本平台上。

来源:https://tech.ifeng.com/c/8rCRhRzCXoL

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：19岁少年创AI应用，下载量破1500万、年入2亿被巨头收购下一篇：高通6G商用进程加速：携58个盟友详解6G与AI融合战略

相关攻略

礼仪与书信

古尔曼披露：苹果Apple Intelligence在中国意外上线后下线

3月31日，苹果于今日凌晨开始分批推送国行Apple Intelligence Beta版，需升级至iOS 26 4及以上系统方可体验。彭博社记者马克·古尔曼今日发文称Apple Intellig

热心网友

03.31

当DeepSeek崩溃10小时，梁文锋称是为V4冲击波做准备

DeepSeek网页和App在连崩10多个小时后终于恢复了。这件事给梁文锋提了个醒，网上都说4月份就要发布DeepSeek-V4了，到时候DeepSeek面临的压力会比现在大得多。怎样让服务器在峰值

热心网友

03.30

国产大模型持续霸榜，这一技术为何领跑？

2026 03 30

热心网友

03.30

杨植麟等共话AI大模型趋势：未来12个月将走向何方？

财联社3月29日讯2026年，一只“红色小龙虾”在科技圈引发广泛关注。OpenClaw的爆火，不仅是一次技术产品的出圈，也在中关村论坛期间掀起了关于AI开源生态与智能体未来的深层讨论，杨植麟、张鹏、

热心网友

03.30

苹果认清现实：错失大模型AI机遇后，重回硬件赛道

库克手持iPhone 17 Pro 北京时间3月30日，据彭博社报道，苹果准备开放Siri等AI战略大调整表明，该公司正在重新致力于其核心商业模式：销售硬件和服务，依靠硬件搭建起类似于App Sto

热心网友

03.30

热门推荐

娱乐

14岁小S女儿反驳读书无用论：别把嫁豪门当退路

小S的三个女儿受人关注，一家人的一举一动都能引起大家的讨论与吐槽。尤其是她的三个漂亮女儿，大女儿许曦文20岁，在南加州读大学。二女儿许韶恩18岁，开始在贵圈发展，许老三许曦恩14岁，也开始频繁露面。

热心网友

03.31

礼仪与书信

华硕27吋QHD 180Hz IPS显示器PG27QFT2C/QFT1B选购指南

IT之家 3 月 31 日消息，华擎 ASRock 现已推出两款幻影电竞系列显示器 PG27QFT2C 和 PG27QFT1B。两款型号拥有一致的核心规格，均采用 27 英寸 QHD (2560×1

热心网友

03.31

网络安全

iPhone 20预测：1.1毫米极窄边框与四曲屏将成最大亮点

3月31日消息，据报道，苹果20周年纪念版iPhone 20将采用1 1毫米极窄屏幕边框，搭配极致圆润的边缘处理与四曲面瀑布屏设计，整机视觉效果接近无缝玻璃面板。此次曝光的设计核心为真全面屏形态，为

热心网友

03.31

电脑教程

QQ邮箱官方登录入口与网页版最新地址

QQ邮箱网页版最新最新地址是https: mail qq com，支持多方式快捷验证、跨终端实时同步、大文件智能传输、智能地址分类管理及多重安全防护。QQ邮箱登录入口正式 QQ邮

热心网友

03.31

科技数码

vivo X300系列正式发布：售价4999元起，专业影像旗舰

2026年3月30日，vivo于云南丽江正式发布vivo X300系列全新旗舰手机——vivo X300 Ultra、vivo X300s，重塑移动影像新高度。打破拍照与摄像的设备鸿沟，带来手机中的

热心网友

03.31