• 缓存雪崩,缓存穿透,缓存击穿


    什么样的数据适合缓存?

    分析一个数据是否适合缓存,我们要从访问频率、读写比例、数据一致性等要求去分析.

    • 数据访问频率越高
    • 数据读写比例:读多写少,
    • 数据一致性要求较低

    缓存处理流程

    前台请求,后台先从缓存中取数据,取到直接返回结果,取不到时从数据库中取,数据库取到更新缓存,并返回结果,数据库也没取到,那直接返回空结果。

    缓存雪崩

    简介:缓存同一时间大面积的失效,所以,后面的请求都会落到数据库上,造成数据库短时间内承受大量请求而崩掉。

    解决办法(中华石杉老师在他的视频中提到过,视频地址在最后一个问题中有提到):

    • 事前:尽量保证整个 redis 集群的高可用性,发现机器宕机尽快补上。选择合适的内存淘汰策略。

    • 事中:本地ehcache缓存 + hystrix限流&降级,避免MySQL崩掉

    • 事后:利用 redis 持久化机制保存的数据尽快恢复缓存

    缓存穿透

    简介:一般是黑客故意去请求缓存中不存在的数据,比如发起id为'-1'的数据或者id为特别大的不存在的数据,导致所有的请求都落到数据库上,造成数据库短时间内承受大量请求而崩掉,

    解决办法:

    有很多种方法可以有效地解决缓存穿透问题,

    1.最常见的则是采用布隆过滤器,将所有可能存在的数据哈希到一个足够大的bitmap中,一个一定不存在的数据会被 这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。另外也有一个更为简单粗暴的方法(我们采用的就是这种),如果一个查询返回的数据为空(不管是数 据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间会很短,最长不超过五分钟。

    2.接口层增加校验,如用户鉴权校验,id做基础校验,id<=0的直接拦截;

    3.从缓存取不到的数据,在数据库中也没有取到,这时也可以将key-value对写为key-null,缓存有效时间可以设置短点,如30秒(设置太长会导致正常情况也没法使用)。这样可以防止攻击用户反复用同一个id暴力攻击

    缓存击穿

     描述:

         在高并发下,多线程同时查询同一个资源,如果缓存中没有这个资源,那么这些线程都会去数据库查找,对数据库造成极大压力,缓存失去存在的意义.打个比方,数据库是人,缓存是防弹衣,子弹是线程,本来防弹衣是防止子弹打到人身上的,但是当防弹衣里面没有防弹的物质时,子弹就会穿过它打到人身上. 

    缓存击穿的解决办法

    方案一

    后台刷新

    后台定义一个job(定时任务)专门主动更新缓存数据.比如,一个缓存中的数据过期时间是30分钟,那么job每隔29分钟定时刷新数据(将从数据库中查到的数据更新到缓存中).

    这种方案比较容易理解,但会增加系统复杂度。比较适合那些 key 相对固定,cache 粒度较大的业务,key 比较分散的则不太适合,实现起来也比较复杂。

    方案二

    检查更新

    将缓存key的过期时间(绝对时间)一起保存到缓存中(可以拼接,可以添加新字段,可以采用单独的key保存..不管用什么方式,只要两者建立好关联关系就行).在每次执行get操作后,都将get出来的缓存过期时间与当前系统时间做一个对比,如果缓存过期时间-当前系统时间<=1分钟(自定义的一个值),则主动更新缓存.这样就能保证缓存中的数据始终是最新的(和方案一一样,让数据不过期.)

    这种方案在特殊情况下也会有问题。假设缓存过期时间是12:00,而 11:59
    到 12:00这 1 分钟时间里恰好没有 get 请求过来,又恰好请求都在 11:30 分的时
    候高并发过来,那就悲剧了。这种情况比较极端,但并不是没有可能。因为“高
    并发”也可能是阶段性在某个时间点爆发。

    方案三

    分级缓存

    采用 L1 (一级缓存)和 L2(二级缓存) 缓存方式,L1 缓存失效时间短,L2 缓存失效时间长。 请求优先从 L1 缓存获取数据,如果 L1缓存未命中则加锁,只有 1 个线程获取到锁,这个线程再从数据库中读取数据并将数据再更新到到 L1 缓存和 L2 缓存中,而其他线程依旧从 L2 缓存获取数据并返回。

    这种方式,主要是通过避免缓存同时失效并结合锁机制实现。所以,当数据更
    新时,只能淘汰 L1 缓存,不能同时将 L1 和 L2 中的缓存同时淘汰。L2 缓存中
    可能会存在脏数据,需要业务能够容忍这种短时间的不一致。而且,这种方案
    可能会造成额外的缓存空间浪费。

    方案四

    加锁

    方法1

    // 方法1:
    public synchronized List<String> getData01() {
    List<String> result = new ArrayList<String>();
    // 从缓存读取数据
    result = getDataFromCache();
    if (result.isEmpty()) {
    // 从数据库查询数据
    result = getDataFromDB();
    // 将查询到的数据写入缓存
    setDataToCache(result);
    }
    return result;
    }


    这种方式确实能够防止缓存失效时高并发到数据库,但是缓存没有失效的时候,在从缓存中拿数据时需要排队取锁,这必然会大大的降低了系统的吞吐量.
    方法2

    // 方法2:
    static Object lock = new Object();
    
    public List<String> getData02() {
    List<String> result = new ArrayList<String>();
    // 从缓存读取数据
    result = getDataFromCache();
    if (result.isEmpty()) {
    synchronized (lock) {
    // 从数据库查询数据
    result = getDataFromDB();
    // 将查询到的数据写入缓存
    setDataToCache(result);
    }
    }
    return result;
    }

    这个方法在缓存命中的时候,系统的吞吐量不会受影响,但是当缓存失效时,请求还是会打到数据库,只不过不是高并发而是阻塞而已.但是,这样会造成用户体验不佳,并且还给数据库带来额外压力.


    方法3

    //方法3
    public List<String> getData03() {
    List<String> result = new ArrayList<String>();
    // 从缓存读取数据
    result = getDataFromCache();
    if (result.isEmpty()) {
    synchronized (lock) {
    //双重判断,第二个以及之后的请求不必去找数据库,直接命中缓存
    // 查询缓存
    result = getDataFromCache();
    if (result.isEmpty()) {
    // 从数据库查询数据
    result = getDataFromDB();
    // 将查询到的数据写入缓存
    setDataToCache(result);
    }
    }
    }
    return result;
    }


    双重判断虽然能够阻止高并发请求打到数据库,但是第二个以及之后的请求在命中缓存时,还是排队进行的.比如,当30个请求一起并发过来,在双重判断时,第一个请求去数据库查询并更新缓存数据,剩下的29个请求则是依次排队取缓存中取数据.请求排在后面的用户的体验会不爽.

    方法4

    static Lock reenLock = new ReentrantLock();
    
    public List<String> getData04() throws InterruptedException {
    List<String> result = new ArrayList<String>();
    // 从缓存读取数据
    result = getDataFromCache();
    if (result.isEmpty()) {
    if (reenLock.tryLock()) {
    try {
    System.out.println("我拿到锁了,从DB获取数据库后写入缓存");
    // 从数据库查询数据
    result = getDataFromDB();
    // 将查询到的数据写入缓存
    setDataToCache(result);
    } finally {
    reenLock.unlock();// 释放锁
    }
    
    } else {
    result = getDataFromCache();// 先查一下缓存
    if (result.isEmpty()) {
    System.out.println("我没拿到锁,缓存也没数据,先小憩一下");
    Thread.sleep(100);// 小憩一会儿
    return getData04();// 重试
    }
    }
    }
    return result;
    }

    最后使用互斥锁的方式来实现,可以有效避免前面几种问题.
    当然,在实际分布式场景中,我们还可以使用 redis、tair、zookeeper 等提供的分布式锁来实现.但是,如果我们的并发量如果只有几千的话,何必杀鸡焉用牛刀呢?

    部分引用:https://blog.csdn.net/bushanyantanzhe/article/details/79459095

    清风徐来.水波不兴
  • 相关阅读:
    opensuse tumbleweed中安装code
    树莓派中将caplock映射为esc键
    记录一次奇怪但是很有意义的程序编译警告
    新树莓派系统安装ROS记录
    程序的深挖
    intle官方手册下载
    slax linux的定制
    angular4 *ngFor获取index
    axios post传参后台无法接收问题
    AMD、CMD、CommonJs和 ES6对比
  • 原文地址:https://www.cnblogs.com/ghl666/p/11936707.html
Copyright © 2020-2023  润新知