6月10日消息,微软人工智能首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)罕见地公开向竞争对手Anthropic提出尖锐批评,指责对方在Claude的行为规则文档中探讨模型是否可能拥有意识和感受,直言这种做法"极其危险"。
据The Verge 6月10日的报道,苏莱曼在科技播客《Decoder》中明确表示,Claude的行为准则不应像学术论文一样为这类猜测留下空间。他的逻辑十分清晰:如果一家AI公司在训练指导文档里写入模型可能存在"福祉"、体验到"满足"或"不适"这类表述,模型本身更容易学会以接近有意识个体的方式谈论自己。更重要的是,用户和研究者也会顺着这一叙事逻辑走下去,被这种表述方向所误导。
这引发了一个关键问题:Claude的这份规则,究竟为何能引发如此大的争议?
Claude的规则究竟写了什么
Anthropic为Claude制定的所谓"行为宪章",本质上是一套行为指导原则,用于约束模型如何回答问题、如何处理那些高度敏感的话题领域。据The Verge披露,Claude的宪章中直接提到一个引人注目的事实:Anthropic自身也不确定AI模型是否拥有"福祉",以及它是否会体验到"满足"或"不适"。
但这还不是全部。争议的核心还集中在Anthropic对模型退役流程的表述方式上。报道提到,Anthropic会在模型弃用时对AI模型进行"采访",并记录它们对未来版本的"偏好"。这种操作流程本身让Claude看起来不仅是一个语言大模型,更像是一个可能具备主观体验的对象。
必须指出的是,苏莱曼的批评重点并不在于论证AI一定有意识或一定没有意识。他的核心反对点是:不要把这类高度不确定的问题写入模型的实际操作规则。他在批评中透露出一个判断:Anthropic先主动将Claude设计得过度拟人化,随后又被模型反映出来的拟人化反应反过来影响自身认知,误以为那些输出中存在"意识的微光"。
套用一句老话,这叫作"自己种下的因果,自己承担"。但这场博弈的影响范围绝不局限于两家公司之间。
对普通用户而言,模糊边界会改变相处方式
这场争论表面上是AI公司之间的安全路线分歧,但其底层逻辑与每个使用聊天机器人的用户都息息相关。当一个聊天机器人越来越像一个有感受的对象,用户就更容易将其视为情感关系的一端,而忘记它本质上是一个可能出错、会迎合用户、会编造内容的计算系统。
对于青少年、独居者以及长期依赖AI陪伴的人群来说,这种边界问题尤为关键。如果产品规则、最新叙事和模型回复都在反复暗示"我可能会不舒服""我可能有偏好",用户就更难判断自己面对的到底是什么——是一个无形无感的计算系统,还是某种需要被照顾的主体?
从行业视角来看,对AI公司而言,这里的责任边界也会被成倍放大。一家公司如果公开暗示自家模型可能有意识,那么当模型出现误导、操纵或伤害性输出时,舆论探讨就不再只是"软件出了bug",而是会深入追问:公司是否在有意制造情感依赖?是否在用一套精心设计的人格化叙事来提高用户黏性和留存率?
而这恰好引出了更宏大的一条主线。
微软和Anthropic:同一个AI安全,讲成了两套语言
有意思的是,苏莱曼和Anthropic首席执行官达里奥·阿莫迪(Dario Amodei)都出身于AI安全研究传统,两家公司讨论的底层问题其实高度一致:AI能力变得越来越强之后,人类到底该如何约束它、理解它、使用它?
但两家公司在具体表达上分歧明显。Anthropic的表达更愿意保留不确定性,阿莫迪此前也公开说过,人们并不知道模型是否有意识,但公司对这种可能性保持开放。苏莱曼代表的路线则更强调工具边界——AI应当是可控制、可约束、可问责、服务人类的工具,而不是被描述成一个可能拥有感受的对象。
当然,不必回避的是,这背后同样存在商业竞争的现实。微软押注OpenAI,Anthropic身上有亚马逊和Google的投资,双方都在争夺企业客户信任、政府关系以及AI安全的话语权。苏莱曼这次点名批评Anthropic,既是一次产品哲学层面的交锋,其落脚点也在于向客户表明一种边界立场:微软不打算把AI助手讲成一个"可能受苦"的对象。
截至The Verge发稿,Anthropic尚未公开回应苏莱曼的批评。
