• Redis 缓存双写不一致性的问题


    参考:https://www.cnblogs.com/renxiuxing/p/14967390.html

    缓存双写不一致的问题描述的是数据库和缓存中的数据一样的问题。

    我们在调用接口去查询的时候按照下面的流程去做处理的;

    数据库和缓存的更新的问题

    对于更新完数据库,是更新缓存呢,还是删除缓存?又或者是先删除缓存,再更新数据库,其实大家存在很大的争议。

    从理论上来说,给缓存设置过期时间,是保证最终一致性的解决方案

    对存入缓存的数据设置过期时间,只要到达过期时间,读请求自然会从数据库中读取新值然后回填缓存,保证是数据的最终一致;所有的写请求都以数据库为准,对缓存的操作只是尽最大努力处理到一致即可。

    三种更新策略

    • 先更新数据库,再更新缓存;
    • 先删除缓存,再更新数据库;
    • 先更新数据库,再删除缓存;

    先更新数据库,再更新缓存

    该方案会导致不一致的原因是:请求A和请求B同时去更新;

    这套方案,大家是普遍反对的。为什么呢?有如下两点原因。

    • 原因一(请求A和B同时去更新

      同时有请求A和请求B进行更新操作,那么会出现:

      (1)请求A更新了数据库;

      (2)请求B更新了数据库;

      (3)请求B更新了缓存;

      (4)请求A更新了缓存;

      按理说请求A更新缓存应该比请求B更新缓存早才对,但是因为网络等原因,B却比A更早更新了缓存,这样就导致了脏数据

    • 原因二(业务场景角度)

      有如下两点:

      (1)如果写入数据库的值,并不是直接写入缓存的,而是要经过一系列复杂的计算再写入缓存。那么,每次的写请求操作都是先写入数据库,经过计算后再写入缓存,无疑是浪费性能的。显然,每次的写请求写入到数据库中之后,删除缓存更为适合,这样就不用去计算了,只有在查询的时候只计算一次就好了。

      (2)如果是一个写数据库场景比较多,而读数据场景比较少的业务需求,采用这种方案就会导致,每次来的写操作都要去更新缓存,实际上好久才会读一次数据,缓存被频繁的更新都做了无用功,浪费了性能。

      所以,针对缓存操作的方案还是采用 删除缓存 的方案较好;

      接下来讨论的就是争议最大的,先删缓存,再更新数据库。还是先更新数据库,再删缓存的问题。

    先删缓存,再更新数据库

    该方案会导致不一致的原因是:同时有一个请求A进行更新操作,请求B进行查询操作。

    那么会出现如下情形:

    (1)请求A进行先删除缓存;

    (2)请求B查询发现缓存不存在,请求B去数据库查询得到旧值,并将旧值写入缓存;

    (3)请求A将新值写入数据库;

    上述情况就会导致不一致的情形出现。而且,如果不采用给缓存设置过期时间策略,该数据永远都是脏数据。

    那么,如何解决呢?

      采用延时双删策略:

      (1)先删除缓存;
      (2)再更新数据库;
      (3)休眠1秒,再次删除缓存;

    延时双删的策略还是不太好,因为休眠的这个时间不太好把控,而且影响接口的性能;若将休眠 一会,再去删除缓存的操作给异步处理了,那么可以解决性能的问题,但是若异步处理的时候失败了,还是会出现缓存不一致的问题。

    先更新数据库,再删缓存

    首先,先说一下。老外提出了一个缓存更新套路,名为《Cache-Aside pattern》。其中就指出

    • 失效:应用程序先从cache取数据,没有得到,则从数据库中取数据,成功后,放到缓存中。
    • 命中:应用程序从cache中取数据,取到后返回。
    • 更新:先把数据存到数据库中,成功后,再让缓存失效。

    另外,知名社交网站facebook也在论文《Scaling Memcache at Facebook》中提出,他们用的也是先更新数据库,再删缓存的策略

    这种情况不存在并发问题么?

    不是的。假设这会有两个请求,一个请求A做查询操作,一个请求B做更新操作,那么会有如下情形产生
    (1)缓存刚好失效;
    (2)请求A查询数据库,得一个旧值;
    (3)请求B将新值写入数据库;
    (4)请求B删除缓存;
    (5)请求A将查到的旧值写入缓存;

    如果发生上述情况,确实是会发生脏数据

    然而,发生这种情况的概率又有多少呢?

    发生上述情况有一个先天性条件,就是步骤(3)的写数据库操作比步骤(2)的读数据库操作耗时更短,才有可能使得步骤(4)先于步骤(5)。可是,大家想想,数据库的读操作的速度远快于写操作的(不然做读写分离干嘛,做读写分离的意义就是因为读操作比较快,耗资源少),因此步骤(3)耗时比步骤(2)更短,这一情形很难出现。

  • 相关阅读:
    Leetcode: Total Hamming Distance
    Leetcode: Hamming Distance
    Leetcode: Valid Word Square
    Leetcode: Sentence Screen Fitting
    Leetcode: Minimum Unique Word Abbreviation
    Leetcode: Design Phone Directory
    Leetcode: Valid Word Abbreviation
    Leetcode: Range Addition
    Leetcode: Find Leaves of Binary Tree
    Leetcode: Design Hit Counter
  • 原文地址:https://www.cnblogs.com/yufeng218/p/16138225.html
Copyright © 2020-2023  润新知