• Redis++:Redis 内存爆满 之 淘汰策略


    前言:

      我们的redis使用的是内存空间来存储数据的,但是内存空间毕竟有限,随着我们存储数据的不断增长,当超过了我们的内存大小时,即在redis中设置的缓存大小(maxmeory 4GB),redis会怎么处理呢?

    Redis内存淘汰策略,是被很多小伙伴忽略的知识盲区,注意,是盲区。

    注意,Redis如果内存淘汰策略配置不合理,可能会导致Redis无法服务。

    今天就来聊聊redis的缓存淘汰策略:↓ ↓ ↓

    首先,介绍一下Redis过期删除策略,然后,再介绍Redis淘汰策略.

    1):Redis过期删除策略 

    Redis对于过期的key,有三种删除策略:

    • 定期删除(主动删除:由于惰性删除策略无法保证冷数据被及时删掉,所以Redis会定期主动淘汰一批已过期的key)
    • 惰性删除(被动删除:当读/写一个已经过期的key时,会触发惰性删除策略,直接删除掉这个过期key)
    • 当前已用内存超过maxmemory限定时,触发主动清理策略

    定期删除:

    redis 会将每个设置了过期时间的 key 放入到一个独立的字典中,以后会定期遍历这个字典来删除到期的 key。

    Redis 默认会每秒进行十次过期扫描(100ms一次),过期扫描不会遍历过期字典中所有的 key,而是采用了一种简单的贪心策略。

    1、从过期字典中随机 20 个 key;

    2、删除这 20 个 key 中已经过期的 key;

    3、如果过期的 key 比率超过 1/4,那就重复步骤 1;

    redis默认是每隔 100ms就随机抽取一些设置了过期时间的key,检查其是否过期,如果过期就删除。

    注意这里是随机抽取的。为什么要随机呢?

    你想一想假如 redis 存了几十万个 key ,每隔100ms就遍历所有的设置过期时间的 key 的话,就会给 CPU 带来很大的负载。

    惰性删除:

    所谓惰性策略就是在客户端访问这个key的时候,redis对key的过期时间进行检查,如果过期了就立即删除,不会给你返回任何东西。

    为啥需要两种删除策略呢?

    定期删除可能会导致很多过期key到了时间并没有被删除掉。

    所以就有了惰性删除。假如你的过期 key,靠定期删除没有被删除掉,还停留在内存里,除非你的系统去查一下那个 key,才会被redis给删除掉。

    这就是所谓的惰性删除,即当你主动去查过期的key时,如果发现key过期了,就立即进行删除,不返回任何东西.

    总结:定期删除是集中处理,惰性删除是零散处理

    2):Redis 内存爆满 淘汰置换策略 

    当 Redis 内存使用达到 maxmemory 时,需要选择设置好的 maxmemory-policy 进行对老数据的置换。

    下面是可以选择的置换策略:

    不同于之前的版本,redis5.0为我们提供了八个不同的内存置换策略;很早之前提供了6种。

    1. volatile-lru:从已设置过期时间的数据集中挑选最近最少使用的数据淘汰。
    2. volatile-ttl:从已设置过期时间的数据集中挑选将要过期的数据淘汰。
    3. volatile-random:从已设置过期时间的数据集中任意选择数据淘汰。
    4. volatile-lfu:从已设置过期时间的数据集挑选使用频率最低的数据淘汰。
    5. allkeys-lru:从数据集中挑选最近最少使用的数据淘汰
    6. allkeys-lfu:从数据集中挑选使用频率最低的数据淘汰。
    7. allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
    8. no-enviction(驱逐):禁止驱逐数据,这也是默认策略

    意思是当内存不足以容纳新入数据时,新写入操作就会报错,请求可以继续进行,线上任务也不能持续进行,采用no-enviction策略可以保证数据不被丢失。

    这八种大体上可以分为4中:

    1. lru(Least Recently Used,最近最少使用)
    2. lfu(Least Frequently Used,最不经常使用)、
    3. random(随机)
    4. ttl

    设置 maxmemory-policy 的方法 和 设置 maxmemory 方法类似,通过 redis.conf 或是通过 CONFIG SET 动态修改。

    选择合适的置换策略是很重要的,这主要取决于你的应用的访问模式,当然你也可以动态的修改置换策略;

    并通过用 Redis 命令——INFO 去输出 cache 的命中率情况,进而可以对置换策略进行调优。

    置换策略是如何工作的?

    1. 客户端执行一条新命令,导致数据库需要增加数据(比如set key value)
    2. Redis会检查内存使用,如果内存使用超过 maxmemory,就会按照置换策略删除一些 key
    3. 新的命令执行成功

    我们持续的写数据会导致内存达到或超出上限 maxmemory,但是置换策略会将内存使用降低到上限以下。

    如果一次需要使用很多的内存(比如一次写入一个很大的set),那么,Redis 的内存使用可能超出最大内存限制一段时间。

    LRU 算法机制:

    LRU算法的全称叫做Least Recently Used,也就是最近最少使用原则来进行数据的淘汰算法。

    其原理就是,会将数据放入到一个链表中,当链表中的某个元素被访问时,这个元素就被会提到链表的前面,其他元素,默认向后移动;

    当这个时候我们想缓存中新增一个元素时,也会被增加到链表的头部,那么尾部的最后一个元素就被淘汰了。

    lru的实现思想就是:就是刚被访问的数据,在接下来的时间里,更容易被再次访问,而一段时间没有被访问的数据,之后也不会再次访问。

    但是要将redis的全部数据都放入这样一个链表中的话,redis的数据被频繁访问时,需要不停的移动链表的位置,降低redis的性能。

    所以redis对LRU算法进行了优化 ↓

    在redis中,会给每个数据记录一个最近访问的时间戳(记录在RedisObject的lru字段中),

    当需要进行数据淘汰时,redis就随机筛选出N个数据放入到候选集合中去,然后比较这N个数据中的lru的值,最小的就会被淘汰。

    当再次需要淘汰数据时,这个时候筛选数据放入到第一次创建的淘汰集合中,那么这次筛选就不在是随机筛选,而是能进入候选集合的数据的 lru 字段值必须小于候选集合中最小的 lru 值,

    然后再次将最小的lru的值的数据进行淘汰。

    其中N的配置项为:

    maxmemory-samples 100 # 表示N为100

    LFU 算法机制:

    LFU(Least frequently used)称为最近使用最少的数据将被淘汰,redis在就是在LRU的基础上增加一个次数统计。

    其步骤就是根据数据的访问次数进行筛选,淘汰访问次数少的数据,如果访问次数相同,在根据访问时间进行比较,淘汰访问时间久远的数据。

    redis中的实现方式:就是在RedisObject的字段lru上,拆分为两个部分:

    • ldt值:lru字段的前16bit位,还是用来表示时间戳。
    • counter值:lru字段的后8bit位,用来表示数据的访问次数。

    当 LFU 策略筛选数据时,Redis 会在候选集合中,根据数据 lru 字段的后 8bit 选择访问次数最少的数据进行淘汰。

    当访问次数相同时,再根据 lru 字段的前 16bit 值大小,选择访问时间最久远的数据进行淘汰。

    但是8个bit位,最大只能记录255的值,但是redis中的数据,有时候会被访问成千上万次,那么这个问题如何进行解决呢?

    redis对计数进行了优化,并不是数据被访问一次,counter就会被加1,而是遵循如下规则:↓

    当数据被访问一次时,首先用计数器当前的值乘以配置项lfu_log_factor再加1,再取倒数得到一个p值然后把这个p值和一个取值范围在(0,1)的一个随机数r,进行比大小,只有p值大于r时,counter的值才会被加一

    lfu-log-factor可以调整计数器counter的增长速度,lfu-log-factor越大,counter增长的越慢。
    
    lfu-decay-time是一个以分钟为单位的数值,可以调整counter的减少速度
    #redis部分源码展示
    
    double r = (double)rand()/RAND_MAX;
    
    double p = 1.0/(baseval*server.lfu_log_factor+1);
    
    if (r < p) counter++;

    其中 baseval是计数器的当前值。计数器的默认初始值为5(由代码中的 LFU_INIT_VAL 常量设置),并不是为0,这样可以避免数据刚进入缓存,就因为访问次数少而被立即淘汰。

    当lfu_log_factor取不同的值时,实际访问次数下,counter的值的变化情况:

    在实际的使用场景中,还会有这样一种情况,某些数据可能一开始会被大量的访问,但是过了时间段后,就不会再被访问。

    如果这个时候counter的值很大,就算后续不会被访问,也就不会被redis进行数据淘汰。

    针对这种情况,在redis中,设计了counter的衰减策略。其实现就是根据lfu_decay_time的配置值,来控制访问次数的衰减。

    其流程如下:

    • lfu会计算当前时间和数据最近一次访问的时间差值,并将这个差值换算为分钟单位。
    • 然后在将这个差值除以lfu_decay_time值,得到的就是我们需要减去的值
    • 然后再讲counter的值减去这个值

    这样就可以保证在一段时间后,可以淘汰这部分数据。

    Redis 的淘汰策略怎么选:

    一般来说,有这样一些常用的经验:

    • 在所有的 key 都是最近最经常使用,那么就需要选择 allkeys-lru 进行置换最近最不经常使用的 key,如果你不确定使用哪种策略,那么推荐使用 allkeys-lru
    • 如果所有的 key 的访问概率都是差不多的,那么可以选用 allkeys-random 策略去置换数据
    • 如果对数据有足够的了解,能够为 key 指定 hint(通过expire/ttl指定),那么可以选择 volatile-ttl 进行置换

    volatile-lru 和 volatile-random 经常在一个Redis实例既做cache又做持久化的情况下用到,然而,更好的选择使用两个Redis实例来解决这个问题。

    设置是失效时间 expire 会占用一些内存,而采用 allkeys-lru 就没有必要设置失效时间,进而更有效的利用内存。

  • 相关阅读:
    【Nginx】使用Nginx做反向代理时,关于被代理服务器相应的超时设置
    【Quartz】配置最简单的集群
    【Quartz】将定时任务持久化到数据库
    【Quartz】Quartz的搭建、应用(单独使用Quartz)
    【Linux】用grep在文档中查找内容
    【Linux】方便的SecureCRT文件上传、下载命令
    【MySQL】MySQL复制表结构、表数据
    【Linux】vi(vim)起步学起来有些困难,一步一步温习
    【MySQL】MySQL PLSQL Demo
    【Linux】VMware中为CentOS设置静态IP(非动态获取IP)
  • 原文地址:https://www.cnblogs.com/codingmode/p/15244526.html
Copyright © 2020-2023  润新知