Redis缓存穿透、缓存雪崩和缓存击穿

Redis缓存穿透、缓存雪崩和缓存击穿
Redis 缓存的使用极大地提升了应用程序的整体性能和效率，特别是在查询数据方面，大大降低了查询数据库的频率，但同时也带来了一些问题，其中比较典型的问题包括缓存穿透、缓存雪崩和缓存击穿。

项目中使用缓存Redis查询数据的正常流程

前端用户要访问获取数据时，后端首先会在缓存Redis中查询，如果能查询到数据，则直接将数据返回给用户，流程结束；如果在缓存中没有查询到数据，则前往数据库中查询，此时如果能查询到数据，则将数据返回给用户，同时将数据塞入缓存中，流程结束，如果在数据库中没有查询到数据时，则返回Null，同时流程结束。

正常查询倒没有什么问题，但是仔细看最后一个步骤：“当查询数据库时如果没有查询到数据，则直接返回 Null 给前端用户，流程结束”，如果前端频繁发起访问请求时，恶意提供数据库中不存在的 Key，则此时数据库中查询到的数据将永远为 Null 。由于 Null 的数据是不存入缓存中的，因而每次访问请求时将查询数据库，如果此时有恶意攻击，发起“洪流”式的查询，则很有可能会对数据库造成极大的压力，甚至压垮数据库。这个过程称之为“缓存穿透”，顾名思义，就像是“永远越过了缓存而直接永远地访问数据库”。

缓存穿透
- 指查询一个一定不存在的数据，由于缓存是不命中时需要从数据库查询，查不到数据则不写入缓存，这将导致这个不存在的数据每次请求都要到数据库去查询，进而给数据库带来压力。
- 比较典型的是改造图1的最后一个步骤：即“当查询数据库时如果没有查询到数据，则将Null返回给前端用户，同时将该Null数据塞入缓存中，并对对应的Key设置一定的过期时间，流程结束”。
- 这种方案在一定程度上可以减少数据库频繁查询的压力。
解决方案：4个

(1) 对空值缓存：

如果一个查询返回的数据为空（不管是数据是否不存在），我们仍然把这个空结果（null）进行缓存，设置空结果的过期时间会很短，最长不超过五分钟。

(2) 可访问的名单（白名单）：

使用bitmaps类型定义一个可以访问的名单，名单 id 作为 bitmaps 的偏移量，每次访问和 bitmap 里面的 id 进行比较，如果访问 id 不在 bitmaps 里面，进行拦截，不允许访问。

(3) 采用布隆过滤器：

(布隆过滤器（Bloom Filter）是1970年由布隆提出的。它实际上是一个很长的二进制向量(位图)和一系列随机映射函数（哈希函数）。

布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。)

(4) 进行实时监控：

当发现Redis的命中率开始急速降低，需要排查访问对象和访问的数据，和运维人员配合，可以设置黑名单限制服务

缓存雪崩
- 指的是在某个时间点，缓存中的 Key 集体发生过期失效致使大量查询数据库的请求都落在了 DB（数据库）上，导致数据库负载过高，压力暴增，甚至有可能“压垮”数据库。
- 这种问题产生的原因其实主要是因为大量的 Key 在某个时间点或者某个时间段过期失效导致的。
- 为了更好地避免这种问题的发生，一般的做法是为这些 Key 设置不同的、随机的 TTL（过期失效时间），从而错开缓存中 Key 的失效时间点，可以在某种程度上减少数据库的查询压力。
解决方案：3个

(1) 预先设置热门数据：在redis高峰访问之前，把一些热门数据提前存入到redis里面，加大这些热门数据key的时长。

(2) 实时调整：现场监控哪些数据热门，实时调整 key 的过期时长。

(3) 使用锁：

（1）就是在缓存失效的时候（判断拿出来的值为空），不是立即去load db。

（2）先使用缓存工具的某些带成功操作返回值的操作（比如Redis的SETNX）去 set 一个 mutex key

（3）当操作返回成功时，再进行 load db 的操作，并回设缓存,最后删除 mutex key；

（4）当操作返回失败，证明有线程在 load db，当前线程睡眠一段时间再重试整个 get缓存的方法。

缓存击穿
- 指缓存中某个频繁被访问的 Key（可以称为“热点 Key ”），在不停地扛着前端的高并发请求，当这个 Key突然在某个瞬间过期失效时，持续的高并发访问请求就“穿破”缓存，直接请求数据库，导致数据库压力在某一瞬间暴增。这种现象就像是“在一张薄膜上凿出了一个洞”。
- 这个问题产生的原因主要是热点的 Key 过期失效了。
- 在实际情况中，既然这个Key可以被当作“热点”频繁访问，那么就应该设置这个 Key 永不过期，这样前端的高并发请求将几乎永远不会落在数据库上。
解决方案：4个

(1) 构建多级缓存架构：nginx缓存 + redis缓存 +其他缓存（ehcache等）

(2) 使用锁或队列：

用加锁或者队列的方式保证来保证不会有大量的线程对数据库一次性进行读写，从而避免失效时大量的并发请求落到底层存储系统上。不适用高并发情况.

(3) 设置过期标志更新缓存：

记录缓存数据是否过期（设置提前量），如果过期会触发通知另外的线程在后台去更新实际 key 的缓存。

(4) 将缓存失效时间分散开：

比如我们可以在原有的失效时间基础上增加一个随机值，比如1-5分钟随机，这样每一个缓存的过期时间的重复率就会降低，就很难引发集体失效的事件。

总之，不管是缓存穿透、缓存雪崩还是缓存击穿，其实它们最终导致的后果几乎都是一样的，即给 DB（数据库）造成压力，甚至压垮数据库。而它们的解决方案也都有一个共性，那就是“加强防线”，尽量让高并发的读请求落在缓存中，从而避免直接跟数据库打交道。
相关阅读:
ZZNUOJ_Java1098：复合函数求值（函数专题）(完整代码)
线程入门到基础一篇足够
 【工作技能】如何制作有效的简历
 飞书中板栗看板适合做复杂任务管理吗
 Spring总结1.0
【动态规划】96. 不同的二叉搜索树
 【Java】解决Java报错：ConcurrentModificationException
【云原生】阿里云 RocketMQ介绍
 基于ISO13209（OTX）实现EOL下线序列
 【前端实例代码】用HTML、CSS和JavaScript创建一个简易图片编辑器（实现图片的亮度、饱和度、灰度、颜色反转、图片旋转镜面翻转等滤镜效果）
原文地址：https://blog.csdn.net/weixin_45410366/article/details/126218146

项目中使用缓存Redis查询数据的正常流程

缓存穿透

缓存雪崩

缓存击穿