如何处理SQL语句中的HEX编码注入绕过_对输入流进行16进制检测
HEX编码绕过:当十六进制字面量成为SQL注入的“隐身衣”

在安全对抗的战场上,攻击者的手法总是层出不穷。其中,利用十六进制(HEX)编码绕过传统的关键字和符号过滤,已经成为一种相当经典且有效的SQL注入手段。这背后的原理并不复杂,但防御起来却需要格外细致的考量。
HEX编码在SQL注入中怎么被用来绕过过滤
最直接的玩法,就是用 0x61646D696E 这样的十六进制字面量,直接替换掉原本的字符串 'admin'。想想看,当Web应用防火墙(WAF)或者应用层代码正紧盯着单引号、双引号或者“admin”这类敏感词时,一串纯粹的十六进制数字看起来就“清白”多了。它不包含任何被拦截的字符,而像MySQL这样的数据库,会原生地将这串数字解析为对应的字节序列。所以,WHERE username=0x61646D696E 和 WHERE username='admin' 这两条语句,最终的执行效果可以说是一模一样。
不过,这里有个重要的前提:这种绕过方式高度依赖于数据库本身是否支持十六进制字面量语法。MySQL和PostgreSQL对此是“开箱即用”的;SQLite则需要开启特定的 hex 模式;而在SQL Server里,0x... 通常表示二进制数据,不能直接用于字符串比较,往往需要配合 CONVERT 这类函数来曲线救国。
- 常见绕过场景:当引号被全局过滤,或者像
database()这样的函数名被拦截,但字段值仍然可控时,HEX编码就有了用武之地。 - 典型payload示例:
id=1' AND (SELECT table_name FROM information_schema.tables WHERE table_schema=database() LIMIT 0,1)=0x7573657273 --+ - 一个关键细节:HEX字符串的长度必须是偶数,否则MySQL会直接抛出一个
Incorrect hexadecimal value错误。
为什么单纯检测 0x[0-9a-fA-F]+ 不够用
很多初级的防御方案会想到用正则表达式,比如 0x[0-9a-fA-F]+,来匹配所有疑似HEX编码的字符串。想法不错,但现实是,攻击者有太多办法能让这层检测形同虚设。
- 大小写混用:
0X61646D696E(注意,MySQL是允许大写X的)。 - 中间插入干扰:比如在十六进制数字中插入注释
0x61/**/646D696E,或者换行符0x61%0a646D696E,就能轻松打乱简单的正则匹配。 - 函数包裹:直接不用
0x前缀,改用UNHEX('61646D696E')或者CONV(61646D696E,16,10)这样的函数来达到同样目的。 - 字符串拼接:
CONCAT(0x6164,0x6D696E)这种分而治之的策略,也能有效绕过对完整HEX串的检测。
更棘手的情况是,0x 这个前缀本身可能被WAF误判为无害的普通字符而放行,真正的风险其实隐藏在后面那串可执行的十六进制内容里。这就好比只检查了信封,却忽略了信纸上的密文。
输入流里怎么有效识别可疑HEX编码
所以,防御的核心思路不应该仅仅是“寻找 0x 前缀”,而应该聚焦于“判断这段数据是否会被数据库解释为字符串”。一个更可靠的方案是进行分层检测:
- 第一层(语法层扫描):使用更全面的正则模式,尽可能提取所有疑似HEX字面量的变体。这包括但不限于
0x[0-9a-fA-F]{2,}、0X[0-9a-fA-F]{2,},以及像UNHEX\([^)]+\)、CONV\([^)]+\)这类函数调用模式。 - 第二层(语义层校验):对提取出来的内容进行深度分析。检查其长度是否为偶数;验证字符集是否严格限定在
0-9a-fA-F范围内;尝试对其进行解码(例如用Python的bytes.fromhex("61646D696E")),看是否会抛出异常。 - 一个高危信号:如果发现
0x后面紧跟的十六进制解码后是ASCII控制字符,比如0x27(单引号)、0x3B(分号)、0x3D(等号)或0x20(空格),那么这几乎可以断定是恶意的构造企图。
真实环境中容易忽略的边界点
即便部署了HEX检测规则,在实际的复杂环境中,仍有几个边界点容易被忽略,从而留下防御死角:
- 中间件的“好意”:请求参数可能是
?id=0x61646D696E,但像Nginx、Spring这类中间件或框架,可能在请求到达后端业务逻辑之前,就已经自动完成了URL解码。后端收到的已经是原始的字节流,如果检测逻辑只扫描最原始的HTTP请求体,就会完全失效。 - JSON体内的“伪装”:在POST请求的JSON体中,如
{"username":"0x61646D696E"},这个字符串值只有在经过JSON解析器之后才会暴露出来。因此,检测点必须设在反序列化之后、SQL语句拼接之前这个关键环节。 - 数据库版本的差异:MySQL 8.0及以上版本支持在
0x后跟奇数长度的十六进制数(会自动补零),但旧版本会直接报错。这意味着,不能单纯依靠“是否引发数据库错误”来判断一个HEX串是否合法。
说到底,最稳妥的防御策略,是在进行参数绑定或SQL拼接之前,就对所有输入值做一次统一的“HEX字符串还原与白名单字符检查”。这比单纯依赖静态的模式匹配,要可靠得多。毕竟,安全防御的本质,就是比攻击者想得更深一层。
相关攻略
Cursor的命运,悬在两个速度之间:AI自主编码成熟的速度,和Cursor自我蜕变的速度。 这家公司正处在一个奇特的矛盾点上:它依然蒸蒸日上,却又似乎正在走向绝望。关于这家一度是“Vibe Coding”代名词的明星公司,市场同时存在着两种截然相反却又似乎都能成立的观点。 数据描绘的是一幅烈火烹油
在麒麟V10操作系统中,用户有时会遇到中文显示异常的问题,例如打开文本文件、使用终端、查看系统日志或进入救援模式时,文字呈现为方块、问号或无法识别的乱码。这通常并非系统故障,而是由字符编码配置不当、字体缓存失效或文件编码与环境不匹配所导致。无需担忧,此类问题通常有清晰的排查与解决路径。本文将针对几种
前端硬编码加密密钥会通过浏览器开发者工具暴露,完全不可靠。安全核心在于重构信任模型,应弃用客户端单点加密。推荐方案包括:将加密完全交由服务端处理;若必须前端参与,则采用非对称密钥协商机制;或使用TLS和短期令牌替代。同时需选用SHA-256、AES-GCM等现代算法,并确保初始化向量随机唯一。
SublimeText中中文显示方框问题需分类解决。若Python输出乱码,需在构建配置中设置 "PYTHONIOENCODING ": "utf-8 "(Windows)或 "LANG ": "en_US UTF-8 "(macOS Linux)。侧边栏等UI界面显示方框时,应修改主题配置文件指定中文字体。文件打开即乱码则因编码识别错误,可通过右下角切换编码或调整fall
哈夫曼树用于生成最优二进制编码,核心是构建带权路径最短的二叉树。实现主要有三种方案:基于优先队列的标准方法逻辑清晰;基于向量手动查找实现简单但较慢;基于数组的紧凑实现适合内存受限场景。可根据需求选择。
热门专题
热门推荐
2025年底智能驾驶国标要求,使4D毫米波雷达成为特定安全场景的关键传感器。法规明确的测试场景如远距离静止目标、隧道事故等,恰好是摄像头和激光雷达的能力盲区,凸显其不可替代价值。行业技术路线多元化,边缘与中央架构将长期并存。产业链正从供应商模式转向联合创新,中国在量产速。
梅尔维娅是《芙娅之魂》中的锻造师,负责“余烬”养成系统。玩家通过她将余烬解析并绑定至武器,以解锁战技与词条。不同余烬适配不同属性武器,如雷系余烬可召唤雷电区域并降低敌人雷抗。每件武器仅能绑定一个余烬,且需属性匹配方可生效。
智谱清影生成古风视频时,需通过精准指令确保风格纯粹。可采用四种方法:使用结构化提示词明确镜头、场景与风格;利用图生视频功能配合动态描述与风格锁定;直接调用内置古风模板简化操作;生成后手动干预关键帧,局部修正以强化古风质感。
家用投影仪凭借沉浸式体验和空间灵活性成为家庭显示的重要选择。2026年市场竞争聚焦核心技术、画质与场景适配。选购需关注亮度、画质、空间与性能四大维度。当贝旗下三款机型精准满足不同需求:S7UltraPro提供顶级专业影院画质;X7Max兼顾客厅观影与游戏娱乐;D7XPro则以高性价比和强大空间适应性,成为小户。
苹果M6MacBookPro预计2026年第四季度发布,将采用覆盖主板的均热板散热技术,取代传统单热管方案,配合优化风道与风扇,显著提升散热效率。该机型搭载2纳米制程芯片,配备OLED触控屏,旨在确保高性能持续释放,但起售价预计将明显上涨。





