Uniswap创始人质疑Anthropic新模型安全过滤器缺陷

时间：2026-06-11 12:35

Uniswap创始人HaydenAdams指出，Anthropic新模型ClaudeFable5的安全过滤器存在缺陷，在回答前过滤所有网络安全查询，导致白帽测试与黑客攻击被同一标准拦截，真正的安全检查被跳过。Coinbase和币安已分别接入其他模型进行资安检测。

AI安全过滤机制遭遇挑战：Claude Fable 5误伤白帽测试引发行业担忧

在人工智能模型评估系统安全性的过程中，主动测试是必不可少的首要步骤。然而，Anthropic最新推出的Claude Fable 5却采用了前置过滤策略，在回答之前直接拦截涉及网络安全的查询。这一机制导致了意想不到的后果：真正有效的安全检查被绕过，系统可能陷入“防住了自己人，却漏掉了攻击者”的尴尬局面。

2025年主流加密货币交易所：

欧易OKX >>>进入官网<<< >>>官方下载<<<
币安Binance >>>进入官网<<< >>>官方下载<<<

Uniswap联合创始人Hayden Adams近日在X平台（原Twitter）上公开指出了该模型安全分流设计的致命缺陷。他指出，在底层操作逻辑上，白帽安全测试与黑客攻击使用的是完全相同的技术动作序列。如果人工智能模型采用一刀切的方式将安全查询全部过滤，实质上等同于关闭了系统自身的检测功能。

Adams在推文中直言不讳：“白帽和黑客使用同一种方式做事，机器却把两类请求一起过滤掉。”这种表面看似合理的防护措施，在实际运行中反而使得真正必要的安全检查被遗漏，给加密货币和区块链生态带来了潜在风险。

安全分流机制的底层盲点

Anthropic于六月初推出Claude Fable 5时，曾宣称这是针对网络安全领域设置的最严格护栏。但Adams的观点直接指向了问题的核心：AI要判断系统是否安全，第一步就是主动测试，而测试行为本身在本质上就是一种安全查询。例如，白帽工程师与恶意攻击者在检查网站HTML源代码时，执行的指令完全相同。如果模型预先将这些请求过滤掉，就等于跳过了真正的防御检查。

这套安全分流机制的核心逻辑听起来合理——将网络安全请求标记为“活跃动作”，然后从原始数据中提取答案。然而问题恰恰出在这里：白帽测试与黑客攻击在底层共享同一套动作集，过滤机制根本无法区分两者的身份差异。这种“一刀切”的设计不仅未能提升安全性，反而制造了新的盲区。

安全查询被错误归类为“可疑活动”，导致合法测试被误拦
白帽工程师无法获得准确反馈，系统漏洞可能长期潜伏
攻击者却可以通过规避关键词或改变查询方式来绕过过滤

AI模型如何影响加密货币产业安全格局

Uniswap并非唯一关注Claude Fable 5隐患的加密项目。据行业公开信息，Coinbase和币安已分别与Anthropic达成合作，接入了Claude Mythos模型以强化资产安全检测能力。这两个平台的深度介入表明，人工智能模型正在成为加密交易所安全基础设施的核心组件。

Coinbase的Glasswing计划正在利用Claude Mythos进行智能合约审计和链上交易分析，旨在捕捉代码中的潜在漏洞
币安在内部部署了Claude Fable 5，用于交易数据的异常检测和实时风险预警

然而，Adams的批评为整个行业敲响了警钟：AI模型的安全护栏并非万能解药。如果模型在底层机制上就已经将白帽测试请求过滤掉，那么依赖AI进行安全检测的加密交易所，很可能在不自知的情况下错过真正的安全威胁。例如，智能合约中的隐藏后门、闪电贷攻击的前兆模式、以及跨链桥的权限缺陷，都有可能因为AI的过度过滤而无法被及时发现。

数据与案例支撑：AI安全过滤的潜在风险

根据区块链安全机构SlowMist发布的2024年半年度报告，上半年因智能合约漏洞造成的损失超过4.8亿美元，其中约30%的攻击手法与白帽测试中常见的操作路径高度重叠。这意味着，如果AI模型简单地将这些操作路径判定为“可疑请求”并加以过滤，防御体系将形同虚设。另一组来自CertiK的数据显示，在采用AI辅助审计的项目中，有12%的漏洞被AI错误标记为“良性”，而这些漏洞最终在实际攻击中造成了重大损失。

Anthropic的过滤机制默认将所有与网络安全相关的查询归类为“活跃动作”，但缺乏对上下文和意图的深度理解。例如，白帽工程师提交的“检查合约是否包含重入漏洞”与黑客的“寻找重入攻击入口”在语法上几乎一致。机器无法通过简单的关键词匹配或正则表达式来区分两者，这导致安全过滤机制在实操层面产生了“误杀”与“漏报”并存的问题。

行业启示：AI安全设计需要更精细的上下文理解

针对Claude Fable 5暴露出的问题，区块链安全专家建议：AI模型在实施安全过滤时应当引入多维度的上下文分析，而非单纯依靠动作集合的匹配。例如，可以结合请求的来源IP历史、用户认证等级、以及查询的连续行为模式来综合研判。同时，对于白帽社区常用的标准化安全测试框架，应建立白名单机制，避免因通用操作而被错误拦截。

加密交易所和DeFi项目在选择AI安全工具时，也需要评估模型对白帽测试与真实攻击的区分能力。单纯依赖“最严格护栏”的宣传，可能无法应对真实世界中攻击手法的持续进化。唯有将AI的过滤逻辑与人类专家的经验判断相结合，才能构建真正有效的多层防护体系。

未来，随着AI在区块链安全领域渗透率的提升，如何平衡安全防护与功能可用性，将成为所有开发者需要面对的长期课题。而像Adams这样的行业领袖及时指出问题，恰恰说明了一个核心事实：在网络安全面前，没有任何一个过滤器可以替代主动、全面的测试与验证。

来源：https://www.120btc.com/star/692544026.html