缓存穿透--一起学习吧之架构 - 码农知识堂

缓存穿透--一起学习吧之架构
缓存穿透是指查询一个一定不存在的数据，由于缓存是不命中时需要从数据库查询，查不到数据则不写入缓存，这将导致这个不存在的数据每次请求都要到数据库去查询，进而给数据库带来压力。在高并发场景下，如果某个key被高并发访问且没有被命中，出于对容错性的考虑，系统会尝试从后端数据库中获取数据，这可能导致大量请求直接打到数据库上。而当该key对应的数据库本身就是空的情况下，就会导致数据库中并发的去执行很多不必要的查询操作，从而对数据库造成巨大的冲击和压力。

缓存穿透可能由用户伪造不存在的数据ID并频繁请求接口导致，也可能由黑客攻击引起。这种攻击会导致服务器响应缓慢，影响用户体验。

缓存穿透带来的危害主要有以下几点：
1. 后端存储负载加大：由于缓存穿透导致大量请求直接穿透缓存层到达后端存储层，后端存储层需要处理这些额外的请求，从而增加了其负载。如果后端存储不具备高并发处理能力，可能会导致其性能下降，甚至宕机。
2. 系统性能下降：由于大量请求直接打到后端存储层，可能导致系统整体性能下降，响应时间延长，用户体验变差。
3. 安全风险：缓存穿透可能被恶意用户或黑客利用，通过伪造不存在的数据ID进行频繁请求，从而攻击系统，导致系统瘫痪或数据泄露。
为了解决缓存穿透问题，可以采取以下几种策略：
1. 主动方案：
  - 增加ID复杂度：通过提高ID的复杂性和难以预测性，减少被恶意用户或黑客利用的可能性。
  - 数据基础格式校验：对客户端发送的请求进行校验，确保数据格式的合法性，避免非法请求穿透到数据库。
  - 加强用户权限校验：对用户的访问权限进行严格的校验，确保只有合法的用户能够访问数据。
  - 热点参数限流：对热点参数进行限流，防止大量请求同时穿透缓存，对数据库造成过大压力。
2. 被动方案：
  - 缓存空对象：当查询结果为空时，将一个空对象或默认值缓存起来，并设置一个较短的TTL（Time to Live，生存时间）。当再次遇到相同的查询时，可以直接从缓存中返回空对象或默认值，避免再次查询数据库。需要注意的是，这种方式可能会导致缓存中存储大量的无效数据，占用内存空间。
  - 使用布隆过滤器：布隆过滤器是一种空间效率极高的概率型数据结构，它利用位数组和哈希函数来判断一个元素是否在一个集合中。将所有已存在的数据key放入布隆过滤器中，当新的请求到来时，先通过布隆过滤器判断该key是否存在。如果不存在，则直接返回；如果存在，再到缓存和数据库中进行查询。这种方式可以有效减少不必要的数据库查询，提高系统性能。
  - 限制分页数量：对于需要分页查询的场景，可以通过限制最大分页数来减少缓存穿透的风险。例如，可以设置最大分页数为100页，超过该分页数的请求直接返回空值或错误提示。
需要注意的是，以上方案并非绝对完美，需要根据具体的应用场景和需求进行选择和调整。同时，也需要对缓存和数据库进行监控和调优，确保系统的稳定性和性能。
相关阅读:
Python中类型的可变和不可变、变量赋值浅复制深复制后变量id的变化、小整数、拆包应用交换两个变量的值和Python中几种输出方式
 CSM32RV003：国产高精度16位ADC低功耗RISC-V内核MCU
设计模式——单例模式（非常实用）
Android 10.0 系统禁用深色主题背景功能
 小红书店铺的所有商品API接口（整店商品详情查询接口）
丁鹿学堂：移动端开发之css常用单位总结
 20天等待，申请终于通过，安装和体验IntelliJ IDEA新UI预览版
 实现公共字段自动填充技术点：枚举、注解、AOP、反射
 min_max_gray
AbstractQueuedSynchronizer(AQS)之 ReentrantLock 源码浅读
原文地址：https://blog.csdn.net/wd90119/article/details/136389754