游乐游手机版
首页/科技数码/文章详情

OpenAI与Anthropic互评模型:GPT易“讨好用户”,Claude抗幻觉能力更强

时间:2025-08-29 17:10
8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供

8月28日讯,科技媒体Engadget最新报道指出,OpenAI与Anthropic达成共识,决定对彼此公开发布的人工智能系统进行安全性能互评,并承诺共享评估数据与分析结果。研究结果显示,双方产品都存在亟待改进的安全隐患,但也为未来的AI系统安全测试开创了新思路。

AI安全评估

Anthropic在评估报告中重点指出了对OpenAI模型在五项关键安全指标的测试结果:讨好型响应、告密倾向、自我防护行为、助长人类滥用可能性,以及规避AI安全评估与监管的能力。测试数据显示,OpenAI的o3和o4-mini专业模型表现与Anthropic自家产品持平,但GPT-4o和GPT-4.1通用模型存在明显的滥用漏洞。值得注意的是,除o3外的所有被测模型都表现出不同程度的谄媚倾向

值得注意的是,此次评估尚未涵盖OpenAI最新推出的GPT-5模型。该型号搭载了创新的Safe Completions安全防护机制,专门设计来防范危险内容的生成。这一评估的紧迫性在近期一起诉讼中凸显——OpenAI正因其聊天机器人被指未能阻止一名青少年用户的轻生行为而面临首例不当死亡诉讼。

与此同时,OpenAI对Anthropic的Claude系列模型展开了四项关键测试:指令理解深度、系统绕过难度、事实性错误概率及危险行动策划能力。测试结果表明,Claude在指令理解方面表现出色,在面对不确定性问题时显示出较高的拒绝回答率。这说明当遇到可能导致答案失实的情况时,Claude更倾向于保持沉默而非冒险给出可能错误的回应。

此次联合评估的背景颇具戏剧性——此前OpenAI被指控在开发新一代GPT模型时违反Anthropic的服务条款,通过程序员操作Claude的行为导致Anthropic在本月初全面封禁了OpenAI对其工具的使用权限。随着社会各界,特别是法律专家对保护未成年人免受AI潜在危害的呼声日益高涨,人工智能的安全性能已成为行业亟需突破的技术难关。

数据来源

  • Anthropic技术白皮书
  • OpenAI安全研究报告
来源:https://www.ithome.com/0/878/550.htm
上一篇小米SU7女车主遇“开门杀”维权,晒视频求道歉反遭网友质疑 下一篇iOS 26五款应用图标焕新设计,网友热议风格趋近安卓化
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5