游乐游手机版
首页/AI热点日报/热点详情

OpenAI与Anthropic同意新模型发布前交由美政府安全评估

类型:热点整理2026-07-03
OpenAI和Anthropic同意在发布重大新模型前,允许美国政府先行访问以评估安全性。美国人工智能安全研究所宣布签署备忘录,旨在共同评估风险并制定缓解方案。这是大模型面向公众前更严格的压力测试,标志着从自愿承诺走向正式协议的重要一步。

人工智能领域的领先企业 OpenAI 与 Anthropic 已达成共识,在推出重大新模型之前,将率先向美国政府开放访问权限,以便双方共同开展安全评估并提升模型可靠性。

OpenAI 和 Anthropic 同意推出新模型前交给美国政府评估安全

美国人工智能安全研究所(US AI Safety Institute)于本周四正式宣布,两家公司已与其签署谅解备忘录,承诺在模型公开发布前后提供接入权限。此举的核心目标在于,让政府能够参与安全风险的联合评估,并协助制定缓解潜在问题的应对方案。该机构还透露,正与英国相关机构展开合作,围绕安全改进方向提供反馈意见。从某种意义上说,这意味着大模型在面向公众之前,将经历一轮更加严格的“压力测试”,从而进一步强化人工智能安全监管机制。

对于这次合作,OpenAI 首席战略官 Jason Kwon 第一时间表态支持:

  • “我们非常支持美国 AI 安全研究所的使命,并期待一起合作,制定 AI 模型的安全最佳实践和标准。我们相信,该研究所在确保美国在负责任开发 AI 方面的领导地位上扮演着关键角色。我们期望通过与研究所的合作,能为全球提供一个可以借鉴的框架。”

Anthropic 方面同样认为,建立有效的 AI 模型测试能力是当务之急。公司联合创始人兼政策负责人 Jack Clark 提到:

  • “确保 AI 安全可靠,对于让这项技术带来积极影响是至关重要的。通过这样的测试和合作,可以更好地发现和减少 AI 带来的风险,推动负责任的 AI 发展。我们为能够参与这项重要工作感到自豪,并希望为 AI 的安全性和可信度设立新的标准。”

从更宏观的背景来看,联邦和州立法机构正在绞尽脑汁,思考如何在“为技术设置限制”与“不扼杀创新”之间找到平衡点。在此背景下,共享 AI 模型的访问权限无疑是向前迈出的重要一步。就在本周三,加利福尼亚州立法者刚刚通过了备受争议的《前沿人工智能模型安全创新法案》(SB 1047)。该法案要求加州的人工智能公司在训练先进基础模型之前,必须采取特定的安全措施。这一立法动向迅速引起了包括 OpenAI 和 Anthropic 在内的多家 AI 公司的反对。他们普遍担心,该法案可能会对规模较小的开源开发者造成不利影响——尽管法案已经经历过一轮修改,目前仍在等待加州州长加文·纽瑟姆的最终签署。

与此同时,白宫方面也一直在努力,试图从各大科技公司手中获得关于 AI 安全措施的“自愿承诺”。事实上,多家领先的 AI 公司已经做出了一系列非约束性承诺,内容包括投资于网络安全、歧视研究,以及对 AI 生成内容进行水印标记。这些动作虽然不具备强制力,但至少表明业界已经意识到,人工智能安全这根弦不能松懈。

美国人工智能安全研究所所长伊丽莎白・凯利在一份声明中强调,这些新签署的协议仅仅是一个“开始”,但它们无疑是“我们努力帮助负责任地管理人工智能未来的一个重要里程碑”。从“自愿”到“协议”,这一转变本身就是一个值得关注的信号,也预示着人工智能行业监管正向更具约束力的方向发展。

来源:https://www.1ai.net/18927.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。