• Redis 持久化原理及过期 key 清除策略


    Redis RDB 持久化原理

    1)RDB 持久化配置

    # 时间策略,表示900s内如果有1条是写入命令,就触发产生一次快照,可以理解为就进行一次备份
    save 900 1
    save 300 10 # 表示300s内有10条写入,就产生快照
    save 60 10000 # 表示60s内有10000条写入,就产生快照
    
    # 文件名称
    dbfilename dump.rdb
    
    # 如果持久化出错,主进程是否停止写入
    stop-writes-on-bgsave-error yes
    
    # 是否压缩
    rdbcompression yes
    
    # 导入时是否检查
    rdbchecksum yes
    
    # 文件保存路径
    dir /usr/local/redis-4.0.6

    2)save 的含义

    实际生产环境每个时段的读写请求肯定不是均衡的,为此 redis 提供一种根据 key 单位时间操作次数来触发一次备份到磁盘,我们可以自由定制什么情况下触发备份,此功能起到平衡性能与数据安全的作用

    3)在 Redis 中 RDB 持久化的触发分为两种:自己手动触发与 Redis 定时触发

    针对 RDB 方式的持久化,手动触发可以使用:

    • save:会阻塞当前 Redis 服务器,直到持久化完成,线上应该禁止使用。
    • bgsave:该触发方式会 fork 一个子进程,由子进程负责持久化过程,因此阻塞只会发生在 fork 子进程的时候

    而自动触发的场景主要是有以下几点:

    • 根据我们的 save m n 配置规则自动触发
    • 从节点全量复制时,主节点发送 rdb 文件给从节点完成复制操作,主节点会触发 bgsave
    • 执行 debug reload 时
    • 执行 shutdown 时,如果没有开启aof,也会触发

    4)禁用RDB

    只需要在 save 的最后一行写上:save ""

    Redis AOF 持久化原理

    1)AOF 持久化配置

    # 是否开启aof
    appendonly yes
    
    # 文件名称
    appendfilename "appendonly.aof"
    
    # 同步方式
    appendfsync everysec
    
    # aof重写期间是否同步
    no-appendfsync-on-rewrite no
    
    # 重写触发配置
    auto-aof-rewrite-percentage 100
    auto-aof-rewrite-min-size 64mb
    
    # 加载aof时如果有错如何处理
    aof-load-truncated yes # yes表示如果aof尾部文件出问题,写log记录并继续执行。no表示提示写入等待修复后写入
    
    # 文件重写策略
    aof-rewrite-incremental-fsync yes

    2)appendfsync 同步模式有三种模式,一般情况下都采用 everysec 配置,在数据和安全里面做平衡性选择,最多损失1s的数据

    • always:把每个写命令都立即同步到 aof,很慢,但是很安全
    • everysec:每秒同步一次,是折中方案
    • no:redis 不处理交给 OS 来处理,非常快,但是也最不安全

    3)AOF 的整个流程大体来看可以分为两步

    第一步是命令的实时写入(如果是 appendfsync everysec 配置,会有 1s 损耗)。

    第二步是对 aof 文件的重写。

    步骤:

    命令写入=》追加到 aof_buf =》通过时间事件调用 flushAppendOnlyFile 函数同步到 aof 磁盘

    原因:

    实时写入磁盘会带来非常高的磁盘 IO,影响整体性能

    4)AOF 持久化的效率和安全性分析

    • always:每个时间事件循环都将 AOF_BUF 缓冲区的所有内容写入到 AOF 文件,并且同步 AOF 文件,这是最安全的方式,但磁盘操作和阻塞延迟,是 IO 开支较大。
    • everysec:每秒同步一次,性能和安全都比较中庸的⽅方式,也是 redis 推荐的方式。如果遇到物理服务器故障,有可能导致最近一秒内 aof 记录丢失(可能为部分丢失)。
    • no:redis 并不直接调用文件同步,而是交给操作系统来处理,操作系统可以根据 buffer 填充情况/通道空闲时间等择机触发同步;这是一种普通的文件操作方式。性能较好,在物理服务器故障时,数据丢失量会因 OS 配置有关。处于 no 模式下的 flushAppendOnlyFile 调用无须执行同步操作

    Redis 两种持久化方案对比

    Redis 提供了不同的持久性选项:

    • RDB 持久性以指定的时间间隔执行数据集的时间点快照。
    • AOF 持久性记录服务器接收的每个写入操作,将在服务器启动时再次播放,重建原始数据集。使用与 Redis 协议本身相同的格式以仅追加方式记录命令。当 Redis 太大时,Redis 能够重写日志背景。

    RDB 的优缺点

    优点:

    • RDB 最大限度地提高了 Redis 的性能,父进程不需要参与磁盘 I/O
    • 与 AOF 相比,RDB 允许使用大数据集更快地重启

    缺点:

    • 如果您需要在 Redis 停止工作时(例如断电后)将数据丢失的可能性降至最低,则 RDB 并不好
    • RDB 经常需要 fork() 才能使用子进程持久存储在磁盘上。如果数据集很大,fork() 可能会非常耗时

    AOF 的优缺点

    优点:

    • 数据更加安全
    • 当 Redis AOF 文件太大时,Redis 能够在后台自动重写 AOF
    • AOF 以易于理解和解析的格式一个接一个地包含所有操作的日志

    缺点:

    • AOF 文件通常比同一数据集的等效 RDB 文件大
    • 根据确切的fsync策略,AOF 可能比 RDB 慢

    RDB 和 AOF,我应该用哪一个?

    一般来说,如果想达到足以媲美 PostgreSQL 的数据安全性, 你应该同时使用两种持久化功能。如果你非常关心你的数据,但仍然可以承受数分钟以内的数据丢失,那么你可以只使用 RDB 持久化。有很多用户都只使用 AOF 持久化, 但我们并不推荐这种方式:因为定时生成 RDB 快照(snapshot)非常便于进行数据库备份, 并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快。

    在线上我们到底该怎么做?

    • RDB 持久化与 AOF 持久化同步使用
    • 如果 Redis 中的数据并不是特别敏感或者可以通过其它方式重写生成数据,可以关闭持久化,如果丢失数据可以通过其它途径补回
    • 自己制定策略定期检查 Redis 的情况,然后可以手动触发备份、重写数据
    • 采用集群和主从同步

    Redis 过期 key 清除策略

    Redis 如何淘汰过期的 keys?

    惰性删除 :

    概念:当一些客户端尝试访问它时,key 会被发现并主动的过期。放任键过期不管,但是每次从键空间中获取键时,都检查取得的键是否过期,如果过期的话,就删除该键

    特点:CPU 友好,但如果一个 key 不再使用,那么它会一直存在于内存中,造成浪费

    定时删除:

    概念:设置键的过期时间的同时,创建一个定时器(timer),让定时器在键的过期时间来临时,立即执行对键的删除操作

    定期删除:

    隔一段时间,程序就对数据库进行一次检查,删除里面的过期键,至于要删除多少过期键,以及要检查多少个数据库,则由算法决定。 即设置一个定时任务,比如10分钟删除一次过期的 key;间隔小则占用 CPU,间隔大则浪费内存

    例如 Redis 每秒处理:

    1. 测试随机的 20 个 keys 进⾏行行相关过期检测。
    2. 删除所有已经过期的 keys。
    3. 如果有多于 25% 的 keys 过期,重复步奏1

    Redis 服务器实际使用的是惰性删除和定期删除两种策略:通过配合使用这两种删除策略,服务器可以很好地在合理使用 CPU 时间和避免浪费内存空间之间取得平衡。

    惰性删除策略是怎么实现?

    通过 expireIfNeeded 函数,当我们操作 key 的时候进行判断 key 是否过期。

    定期删除策略是怎么实现的?

    通过 activeExpireCycle 函数,serverCron 函数执行时,activeExpireCycle 函数就会被调用,规定的时间里面分多次遍历服务器的 expires 字典随机检查一部分 key 的过期时间,并删除其中的过期 key。

  • 相关阅读:
    SQL Server 2008的审核功能
    在SSMS(2008)中对数据库对象进行搜索和筛选
    关于在ASP.NET应用程序中异步调用Web Service的解决方案
    SSIS 2008中的Data Profiler任务
    开始Windows Embedded之旅
    在Access中计算两个日期之间的工作日天数
    当PrintForm遇到"RPC服务不可用的错误”
    REST 的知识 【转载】
    在C#中实现类似Eval这类动态求值的函数【转载】
    行内数据
  • 原文地址:https://www.cnblogs.com/jwen1994/p/12264247.html
Copyright © 2020-2023  润新知