OpenAI与Anthropic同意新模型发布前交由美政府安全评估_AI热点日报

OpenAI与Anthropic同意新模型发布前交由美政府安全评估

类型：热点整理2026-07-03

OpenAI和Anthropic同意在发布重大新模型前，允许美国政府先行访问以评估安全性。美国人工智能安全研究所宣布签署备忘录，旨在共同评估风险并制定缓解方案。这是大模型面向公众前更严格的压力测试，标志着从自愿承诺走向正式协议的重要一步。

人工智能领域的领先企业 OpenAI 与 Anthropic 已达成共识，在推出重大新模型之前，将率先向美国政府开放访问权限，以便双方共同开展安全评估并提升模型可靠性。

OpenAI 和 Anthropic 同意推出新模型前交给美国政府评估安全

美国人工智能安全研究所（US AI Safety Institute）于本周四正式宣布，两家公司已与其签署谅解备忘录，承诺在模型公开发布前后提供接入权限。此举的核心目标在于，让政府能够参与安全风险的联合评估，并协助制定缓解潜在问题的应对方案。该机构还透露，正与英国相关机构展开合作，围绕安全改进方向提供反馈意见。从某种意义上说，这意味着大模型在面向公众之前，将经历一轮更加严格的“压力测试”，从而进一步强化人工智能安全监管机制。

对于这次合作，OpenAI 首席战略官 Jason Kwon 第一时间表态支持：

“我们非常支持美国 AI 安全研究所的使命，并期待一起合作，制定 AI 模型的安全最佳实践和标准。我们相信，该研究所在确保美国在负责任开发 AI 方面的领导地位上扮演着关键角色。我们期望通过与研究所的合作，能为全球提供一个可以借鉴的框架。”

Anthropic 方面同样认为，建立有效的 AI 模型测试能力是当务之急。公司联合创始人兼政策负责人 Jack Clark 提到：

“确保 AI 安全可靠，对于让这项技术带来积极影响是至关重要的。通过这样的测试和合作，可以更好地发现和减少 AI 带来的风险，推动负责任的 AI 发展。我们为能够参与这项重要工作感到自豪，并希望为 AI 的安全性和可信度设立新的标准。”

从更宏观的背景来看，联邦和州立法机构正在绞尽脑汁，思考如何在“为技术设置限制”与“不扼杀创新”之间找到平衡点。在此背景下，共享 AI 模型的访问权限无疑是向前迈出的重要一步。就在本周三，加利福尼亚州立法者刚刚通过了备受争议的《前沿人工智能模型安全创新法案》（SB 1047）。该法案要求加州的人工智能公司在训练先进基础模型之前，必须采取特定的安全措施。这一立法动向迅速引起了包括 OpenAI 和 Anthropic 在内的多家 AI 公司的反对。他们普遍担心，该法案可能会对规模较小的开源开发者造成不利影响——尽管法案已经经历过一轮修改，目前仍在等待加州州长加文·纽瑟姆的最终签署。

与此同时，白宫方面也一直在努力，试图从各大科技公司手中获得关于 AI 安全措施的“自愿承诺”。事实上，多家领先的 AI 公司已经做出了一系列非约束性承诺，内容包括投资于网络安全、歧视研究，以及对 AI 生成内容进行水印标记。这些动作虽然不具备强制力，但至少表明业界已经意识到，人工智能安全这根弦不能松懈。

美国人工智能安全研究所所长伊丽莎白・凯利在一份声明中强调，这些新签署的协议仅仅是一个“开始”，但它们无疑是“我们努力帮助负责任地管理人工智能未来的一个重要里程碑”。从“自愿”到“协议”，这一转变本身就是一个值得关注的信号，也预示着人工智能行业监管正向更具约束力的方向发展。

来源：https://www.1ai.net/18927.html

OpenAI 和 Anthropic 同意推出新模型前交给美国政府评估安全

延伸阅读

补充最近整理过的热点入口。

OpenAI与Anthropic同意新模型发布前交由美政府安全评估

相关热点

延伸阅读