OpenAI掌门人Altman回应行业担忧:警惕“恐惧营销”背后的控制叙事
最近,AI圈子里关于Anthropic新模型Claude Mythos的讨论热度不低,不少声音表达了对它强大能力的担忧。不过,OpenAI的首席执行官Sam Altman对此有不同看法。他在科技记者Ashley Vance的播客节目《核心内存》中直言不讳,认为这种日益增长的担忧背后,可能掺杂着一种“基于恐惧的营销”策略,其潜在目的是将尖端人工智能的控制权集中在“一小部分人”手中。
“你可以用很多角度来论证这件事,有些理由确实是站得住脚的,比如合理的安全隐患确实存在,”Altman承认。但他话锋一转,点出了问题的另一面:“但如果你想说的是‘我们需要控制AI,而且只有我们能控制,因为我们才是可信赖的人’,那么,基于恐惧的营销恐怕就是为这种想法辩护的最有效手段了。”
他进一步打了个生动的比方:虽然人们对AI安全有正当忧虑,但“这显然是一种效果惊人的营销话术:‘我们造了颗冲击波,正准备扔到你头上。现在,我们愿意以1亿美元的价格卖给你一个防空洞。你需要它来保护你的一切——当然,前提是我们选择你作为客户。’”
Altman指出,平衡AI的新能力与OpenAI所秉持的“技术应人人可及”理念,这条路“走起来并不总是那么容易”。
处于风口浪尖的Claude Mythos
上个月,Anthropic发布的Claude Mythos模型引发了广泛关注。研究人员、政府机构以及网络安全行业都投来了审视的目光,尤其是在测试表明该模型能够自主识别软件漏洞并执行复杂网络操作之后。目前,该模型仅通过一个限制性计划,分发给极少数组织。
这一推广模式,实际上折射出AI行业在如何部署强大系统上存在的根本分歧:一派强调受控访问,另一派则主张更广泛的分发,以加速创新和加深对技术的理解。
Mythos已然成为这场辩论的焦点。Anthropic自己将该模型的能力描述为一把双刃剑:既是一项防御性突破(能更快检测关键软件缺陷),也是一个潜在的进攻性风险(如果遭到滥用)。本月初的测试中,它被证实能在Mozilla Firefox 浏览器中识别出数百个漏洞,并且展示了执行多阶段网络攻击模拟的能力。
Anthropic通过“Glasswing项目”严格限制对该系统的访问,仅允许亚马逊、苹果和微软等特定公司测试其功能。该公司同时投入大量资源支持开源安全工作,其逻辑在于:在技术更广泛普及之前,应该先让安全防御者从中受益。
安全专家警告,Mythos识别漏洞的能力,同样可能被用于大规模利用这些漏洞。英国人工智能安全研究所的测试也表明,该模型能够自主完成复杂的网络作战行动。
不仅如此,这个模型还暴露出现有AI评估体系的局限性。Anthropic自己也承认,许多当前的网络安全基准测试,已不足以衡量其最新系统的性能。
当然,也有不同的声音。就在上周,一组研究人员声称,他们利用公开可用的模型,成功复现了Mythos的研究成果。
尽管美国政府内部有部分人士出于对技术可能被用于战争和监视的担忧,呼吁暂停使用,但据报道,美国国家安全局已开始在其分类网络上测试该模型的预览版本。而在预测市场平台Manifold上,用户押注Claude Mythos在6月30日前向公众发布的概率,达到了49%。
Altman的平衡之道与未来展望
Altman认为,随着AI系统能力不断提升,围绕“高度危险AI”的言论势必会增加,但他提醒,并非所有说法都值得全盘当真。
“未来,关于哪些模型过于危险而不能发布,将会有大量争论。同时,也确实会出现一些非常危险的模型,必须以特殊方式发布,”他分析道。“我相信Mythos在网络安全方面是个很棒的模型,但我认为,我们已经制定了一个让我们自己满意的计划,来将这种能力安全地推向世界。”
此外,Altman也驳斥了关于OpenAI正在缩减基础设施支出的说法。他明确表示,尽管舆论风向有所变化,公司仍将继续扩大其计算能力。
“我不清楚这种论调从何而起……人们似乎总想把故事往‘撤资’上引,”他说,“但可以预见,要不了多久,人们可能又会改口说,‘OpenAI太鲁莽了,他们怎么能花这么多钱?’”
