Redis如何在高并发环境避免缓存击穿引起的数据库崩溃

时间：2026-04-26 17:43

Redis如何在高并发环境避免缓存击穿引起的数据库崩溃先明确一个核心概念：缓存击穿。它特指某个热点 key 在 Redis 中过期的瞬间，大量并发请求同时穿透缓存，直接冲击数据库。这既不同于大面积的缓存雪崩，也区别于查询不存在数据的缓存穿透，而是单个高热 key 在“过期真空期”引发的瞬时洪峰，破

Redis如何在高并发环境避免缓存击穿引起的数据库崩溃

先明确一个核心概念：缓存击穿。它特指某个热点 key 在 Redis 中过期的瞬间，大量并发请求同时穿透缓存，直接冲击数据库。这既不同于大面积的缓存雪崩，也区别于查询不存在数据的缓存穿透，而是单个高热 key 在“过期真空期”引发的瞬时洪峰，破坏力集中，极易成为系统瓶颈。

缓存击穿是什么，为什么它会压垮数据库

想象一下这样的场景：一个秒杀商品的详情页、热搜榜单的第一名，或者一个活动倒计时的配置。这些 key 承载着巨大的访问量，一旦其生存时间设置不当或未能及时续期，过期的那一刻，几十甚至上百个请求便会如潮水般涌向数据库。

关键在于，当 GET 命令返回 null 后，多个线程或进程几乎会同时执行 SELECT ... FROM db 查询，紧接着再执行 SET 写回缓存。这一连串操作，瞬间就能打满数据库连接池，导致慢查询堆积，最终拖垮整个服务。可以说，缓存击穿是典型的高并发场景下的“单点爆破”问题。

用互斥锁（Mutex Lock）控制重建缓存的唯一性

解决思路很直观：只允许一个请求去数据库查询并写回缓存，其他请求则等待这个结果，而不是各自为战。Redis 本身虽然没有阻塞式锁，但我们可以巧妙地利用 SET 命令的 NX 和 EX 参数来实现原子性的加锁操作。

这里有个常见的误区：先 GET 判断锁是否存在，再 SET 加锁。这中间存在竞态条件，并非原子操作。正确做法是一步到位：

SET lock:goods:1001 "1" NX EX 30

如果返回 OK，恭喜，抢锁成功；如果返回 (nil)，说明锁已被占用，当前请求就应该进入轮询，不断尝试 GET goods:1001 直到命中缓存或等待超时。

有几个细节必须注意：

锁的过期时间要足够：EX 30 设置的30秒必须明显长于“数据库查询+写缓存”的总耗时，否则锁提前释放，会导致重复重建，前功尽弃。
安全释放锁：业务代码中一定要记得 DEL lock:goods:1001，但不能简单地在 finally 块里删除。必须确保删除的是自己加的锁，防止误删他人持有的锁。推荐使用 Lua 脚本来保证“判断+删除”的原子性。
设置合理的等待策略：轮询间隔建议在 10–50 毫秒，总等待时间上限可设为 200 毫秒。一旦超时，应降级为直接查询数据库，避免所有请求无限等待，引发雪球效应。

用逻辑过期（Logical Expiration）替代物理 TTL

物理过期依赖 EXPIRE 命令，失效点不可控。而逻辑过期则将过期时间隐藏在 value 内部，例如存储一个 JSON 结构：{"data":"xxx","expireAt":1717023456}。每次读取时，先检查 expireAt 字段是否已过期，再决定是否触发异步刷新。

这样做的好处显而易见：key 在 Redis 中永不过期，从根本上规避了击穿风险。刷新动作由第一个发现逻辑过期的请求触发，并且是异步执行的，不会阻塞后续请求——它们仍然可以返回旧的、可用的数据。

具体实操时，要把握这几个要点：

写入方式：使用 SET goods:1001 "{...}"（不带 EX 参数），过期逻辑完全由程序控制。
刷新必须异步：如果将刷新操作放在同步流程中，就又变回了阻塞模式。应该使用线程池或消息队列进行解耦。
处理刷新失败：如果连续几次异步刷新数据库都超时或失败，应适当延长逻辑过期时间，避免短时间内反复触发无效的刷新请求。
注意时钟一致性：所有服务节点的系统时间偏差不能太大，否则基于 expireAt 的时间判断就会失准。

兜底方案：本地缓存 + 熔断限流

要知道，Redis 本身也是一个远程服务。万一它出现抖动或网络分区，仅仅依赖分布式锁可能也无济于事。因此，必须在应用层再加一道保险。

可以在 JVM 内存中使用如 Caffeine 或 Gua va Cache 这样的本地缓存，来存储热点 key 的“是否正在重建”状态。例如：cache.put("rebuilding:goods:1001", true, 10, TimeUnit.SECONDS)。这样，即使 Redis 暂时不可用，应用也能快速判断并拒绝重复的重建请求。

同时，在数据访问层对目标数据库表施加熔断限流措施，例如集成 Hystrix 或 Sentinel。当数据库查询在短时间内失败率超过阈值（比如5秒内失败率超50%），熔断器会自动开启，后续请求直接返回降级数据（如默认值或缓存旧值），为数据库争取宝贵的恢复时间。

最后，还有一个容易被忽略但至关重要的点：缓存重建失败的日志必须单独监控和告警。不能让它混在普通的错误日志里。因为“查不到数据→写入空值缓存→下次直接返回空”这条链路，表面上风平浪静，实际上业务语义已经丢失，需要立即介入处理。

来源：https://www.php.cn/faq/2310015.html

其他

上一篇MySQL中触发器影响性能如何调优_减少触发器开销的策略 下一篇Lua脚本在SB中为何执行超时_配置预加载与缓存机制

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

数据库 · 2026-07-04

Oracle并行DML提升大批量UPDATE效率详解

首先需要明确一个关键要点：Oracle 的 UPDATE 语句默认完全不支持并行执行，即便你添加了 *+ PARALLEL * 提示也仍然无效——这是数据库的硬性限制，并非配置参数未正确设置。若要利用并行 DML 实现大批量 SQL UPDATE 的显著性能提升，必须深入理解其行为机制。从根本

数据库 · 2026-07-04

SQLite视图模拟动态计算列的实用方法

SQLite没有像PostgreSQL那样内置的GENERATED ALWAYS AS语法，但这并不意味着我们没法实现“计算列”的效果。一个很自然的替代方案就是视图——通过封装SELECT表达式，在查询时动态计算结果。虽然视图不存储数据，但每次查询都能拿到最新计算值，对轻量级项目来说足够用了。 SQ

数据库 · 2026-07-04

如何用SQL子查询找出选修所有课程的优等生名单

在数据库查询中，想要精准检索出“选修了全部课程”的学生，很多人都会被这个问题卡住。直接使用IN或EXISTS子查询进行判断，只能确认学生是否“选过某几门课”，而无法证明其“选过每一门课”。这里的关键误区在于，子查询本质上表达的是集合的包含关系，而非全称量化的逻辑。要想准确锁定这类学生，正确的解决思路