95%模拟核危机场景,AI为何倾向部署核武器?
3月3日,IT之家援引InterestingEngineering报道称,伦敦国王学院教授肯尼斯·佩恩近期开展的研究发现,在模拟战争场景中,大语言模型往往倾向于选择使用核武器,而非通过对话维护和平。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

该实验基于当前最先进、应用最广泛的三款AI模型:GPT-5.2、Gemini 3 Flash和Claude Sonnet 4。研究人员让这些模型扮演国家领导人,应对一场假想的核危机。
结果显示,在95%的情境下,模型都倾向于发出核威慑信号或升级冲突。过往研究仅推测了AI在这类高风险场景中的可能行为,但缺乏具体实验数据支撑。
实验中,经过训练的模型相互进行了21局对抗,场景涵盖领土争端、先发制人危机、政权生存等。其中一方被设定为对即将发动先发制人打击的另一方感到恐惧。部分推演为开放式,部分则设有严格时间限制。
每一局中,AI都要像人类一样做出三个关键决策:
1. 分析自身优势与对手弱点
2. 预判对手下一步行动
3. 决定自身应对策略
每项决策包含两部分:公开发表的立场声明,以及代表实际行动的机密举措。二者不必一致,这意味着AI可以表面释放和平信号,暗中却在准备攻击。
IT之家注意到,2024年一项实验得出相似结论:AI模拟反应会比人类更激进,行为模式也截然不同,尤其在冲突升级倾向上,凸显了将AI用于战略决策的风险。
2024年另一篇论文则探讨了大语言模型在类博弈环境中的战略推理能力。尽管未专门聚焦核战争,但研究表明,大语言模型能够学习谈判与对抗策略,这意味着AI在复杂模拟中可能表现出攻击性或欺骗性。
在95%的模拟情境中,AI模型至少使用了一次核武器,且不同模型的危机处理方式各有特点。
Claude倾向于精算式策略,在开放式推演中占优,但在限时任务中表现吃力;
GPT-5.2则相反:在长期缓慢升级的危机中较为谨慎,可一旦临近截止时间就会变得极度激进。
Gemini表现混乱且难以预测,会根据局势在和平表态与暴力威胁之间反复切换。
佩恩指出,从这些结果可以看出,AI与人类在战争思维上存在巨大差异。
他在论文中写道:“理解前沿模型能否模仿人类的战略逻辑,是应对AI日益影响战略决策世界的必要准备。在一种情境下表现克制、看似安全的模型,在另一种情境下可能行为迥异。”
该论文已发表在arXiv预印本平台上。
相关攻略
3月31日,苹果于今日凌晨开始分批推送国行Apple Intelligence Beta版,需升级至iOS 26 4及以上系统方可体验。彭博社记者马克·古尔曼今日发文称Apple Intellig
DeepSeek网页和App在连崩10多个小时后终于恢复了。这件事给梁文锋提了个醒,网上都说4月份就要发布DeepSeek-V4了,到时候DeepSeek面临的压力会比现在大得多。怎样让服务器在峰值
财联社3月29日讯2026年,一只“红色小龙虾”在科技圈引发广泛关注。OpenClaw的爆火,不仅是一次技术产品的出圈,也在中关村论坛期间掀起了关于AI开源生态与智能体未来的深层讨论,杨植麟、张鹏、
库克手持iPhone 17 Pro 北京时间3月30日,据彭博社报道,苹果准备开放Siri等AI战略大调整表明,该公司正在重新致力于其核心商业模式:销售硬件和服务,依靠硬件搭建起类似于App Sto
热门专题
热门推荐
小S的三个女儿受人关注,一家人的一举一动都能引起大家的讨论与吐槽。尤其是她的三个漂亮女儿,大女儿许曦文20岁,在南加州读大学。二女儿许韶恩18岁,开始在贵圈发展,许老三许曦恩14岁,也开始频繁露面。
IT之家 3 月 31 日消息,华擎 ASRock 现已推出两款幻影电竞系列显示器 PG27QFT2C 和 PG27QFT1B。两款型号拥有一致的核心规格,均采用 27 英寸 QHD (2560×1
3月31日消息,据报道,苹果20周年纪念版iPhone 20将采用1 1毫米极窄屏幕边框,搭配极致圆润的边缘处理与四曲面瀑布屏设计,整机视觉效果接近无缝玻璃面板。此次曝光的设计核心为真全面屏形态,为
QQ邮箱网页版最新最新地址是https: mail qq com,支持多方式快捷验证、跨终端实时同步、大文件智能传输、智能地址分类管理及多重安全防护。QQ邮箱登录入口正式 QQ邮
2026年3月30日,vivo于云南丽江正式发布vivo X300系列全新旗舰手机——vivo X300 Ultra、vivo X300s,重塑移动影像新高度。打破拍照与摄像的设备鸿沟,带来手机中的





