缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是换承诺没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。
当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。
1)布隆过滤器
布隆过滤器是一种数据结构,对所有可能查询的参数hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的压力。
2)缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源。
该方法会存在两个问题:
缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。
当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导致数据库瞬间压力过大。
1)设置热点数据永不过期
从缓存层面来看,没有设置过期时间,所以不会出现热点key过期后的问题。
2)加互斥锁
分布式锁:使用分布式锁。保证对于key同时只有一个线程查询后端服务,其他线程没有获取分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
缓存雪崩,是指在某一时间段,缓存集中过期失效,redis宕机。
1)redis高可用
既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后,其他可以继续工作,其实就是搭建集群。
2)限流降级
在缓存失败后,遇到加锁或者队列来控制读数据库写缓存的的线程数量。比如对某key只允许一个线程查询数据和写缓存,其他线程等待。
3)数据预热
在正式部署之前,我先把可能的数据先访问一遍,这样部分可能大量访问的数据会被加载到缓存中,在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。