Redis 持久化原理及过期 key 清除策略

Redis 持久化原理及过期 key 清除策略
Redis RDB 持久化原理

1）RDB 持久化配置
```
# 时间策略，表示900s内如果有1条是写入命令，就触发产生一次快照，可以理解为就进行一次备份
save 900 1
save 300 10 # 表示300s内有10条写入，就产生快照
save 60 10000 # 表示60s内有10000条写入，就产生快照

# 文件名称
dbfilename dump.rdb

# 如果持久化出错，主进程是否停止写入
stop-writes-on-bgsave-error yes

# 是否压缩
rdbcompression yes

# 导入时是否检查
rdbchecksum yes

# 文件保存路径
dir /usr/local/redis-4.0.6
```
2）save 的含义

实际生产环境每个时段的读写请求肯定不是均衡的，为此 redis 提供一种根据 key 单位时间操作次数来触发一次备份到磁盘，我们可以自由定制什么情况下触发备份，此功能起到平衡性能与数据安全的作用

3）在 Redis 中 RDB 持久化的触发分为两种：自己手动触发与 Redis 定时触发

针对 RDB 方式的持久化，手动触发可以使用：
- save：会阻塞当前 Redis 服务器，直到持久化完成，线上应该禁止使用。
- bgsave：该触发方式会 fork 一个子进程，由子进程负责持久化过程，因此阻塞只会发生在 fork 子进程的时候
而自动触发的场景主要是有以下几点：
- 根据我们的 save m n 配置规则自动触发
- 从节点全量复制时，主节点发送 rdb 文件给从节点完成复制操作，主节点会触发 bgsave
- 执行 debug reload 时
- 执行 shutdown 时，如果没有开启aof，也会触发
4）禁用RDB

只需要在 save 的最后一行写上：save ""

Redis AOF 持久化原理

1）AOF 持久化配置
```
# 是否开启aof
appendonly yes

# 文件名称
appendfilename "appendonly.aof"

# 同步方式
appendfsync everysec

# aof重写期间是否同步
no-appendfsync-on-rewrite no

# 重写触发配置
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb

# 加载aof时如果有错如何处理
aof-load-truncated yes # yes表示如果aof尾部文件出问题，写log记录并继续执行。no表示提示写入等待修复后写入

# 文件重写策略
aof-rewrite-incremental-fsync yes
```
2）appendfsync 同步模式有三种模式，一般情况下都采用 everysec 配置，在数据和安全里面做平衡性选择，最多损失1s的数据
- always：把每个写命令都立即同步到 aof，很慢，但是很安全
- everysec：每秒同步一次，是折中方案
- no：redis 不处理交给 OS 来处理，非常快，但是也最不安全
3）AOF 的整个流程大体来看可以分为两步

第一步是命令的实时写入（如果是 appendfsync everysec 配置，会有 1s 损耗）。

第二步是对 aof 文件的重写。

步骤：

命令写入=》追加到 aof_buf =》通过时间事件调用 flushAppendOnlyFile 函数同步到 aof 磁盘

原因：

实时写入磁盘会带来非常高的磁盘 IO，影响整体性能

4）AOF 持久化的效率和安全性分析
- always：每个时间事件循环都将 AOF_BUF 缓冲区的所有内容写入到 AOF 文件，并且同步 AOF 文件，这是最安全的方式，但磁盘操作和阻塞延迟，是 IO 开支较大。
- everysec：每秒同步一次，性能和安全都比较中庸的⽅方式，也是 redis 推荐的方式。如果遇到物理服务器故障，有可能导致最近一秒内 aof 记录丢失(可能为部分丢失)。
- no：redis 并不直接调用文件同步，而是交给操作系统来处理，操作系统可以根据 buffer 填充情况/通道空闲时间等择机触发同步；这是一种普通的文件操作方式。性能较好，在物理服务器故障时，数据丢失量会因 OS 配置有关。处于 no 模式下的 flushAppendOnlyFile 调用无须执行同步操作
Redis 两种持久化方案对比

Redis 提供了不同的持久性选项：
- RDB 持久性以指定的时间间隔执行数据集的时间点快照。
- AOF 持久性记录服务器接收的每个写入操作，将在服务器启动时再次播放，重建原始数据集。使用与 Redis 协议本身相同的格式以仅追加方式记录命令。当 Redis 太大时，Redis 能够重写日志背景。
RDB 的优缺点

优点：
- RDB 最大限度地提高了 Redis 的性能，父进程不需要参与磁盘 I/O
- 与 AOF 相比，RDB 允许使用大数据集更快地重启
缺点：
- 如果您需要在 Redis 停止工作时（例如断电后）将数据丢失的可能性降至最低，则 RDB 并不好
- RDB 经常需要 fork() 才能使用子进程持久存储在磁盘上。如果数据集很大，fork() 可能会非常耗时
AOF 的优缺点

优点：
- 数据更加安全
- 当 Redis AOF 文件太大时，Redis 能够在后台自动重写 AOF
- AOF 以易于理解和解析的格式一个接一个地包含所有操作的日志
缺点：
- AOF 文件通常比同一数据集的等效 RDB 文件大
- 根据确切的fsync策略，AOF 可能比 RDB 慢
RDB 和 AOF，我应该用哪一个？

一般来说，如果想达到足以媲美 PostgreSQL 的数据安全性，你应该同时使用两种持久化功能。如果你非常关心你的数据，但仍然可以承受数分钟以内的数据丢失，那么你可以只使用 RDB 持久化。有很多用户都只使用 AOF 持久化，但我们并不推荐这种方式：因为定时生成 RDB 快照（snapshot）非常便于进行数据库备份，并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快。

在线上我们到底该怎么做？
- RDB 持久化与 AOF 持久化同步使用
- 如果 Redis 中的数据并不是特别敏感或者可以通过其它方式重写生成数据，可以关闭持久化，如果丢失数据可以通过其它途径补回
- 自己制定策略定期检查 Redis 的情况，然后可以手动触发备份、重写数据
- 采用集群和主从同步
Redis 过期 key 清除策略

Redis 如何淘汰过期的 keys？

惰性删除：

概念：当一些客户端尝试访问它时，key 会被发现并主动的过期。放任键过期不管，但是每次从键空间中获取键时，都检查取得的键是否过期，如果过期的话，就删除该键

特点：CPU 友好，但如果一个 key 不再使用，那么它会一直存在于内存中，造成浪费

定时删除：

概念：设置键的过期时间的同时，创建一个定时器（timer），让定时器在键的过期时间来临时，立即执行对键的删除操作

定期删除：

隔一段时间，程序就对数据库进行一次检查，删除里面的过期键，至于要删除多少过期键，以及要检查多少个数据库，则由算法决定。即设置一个定时任务，比如10分钟删除一次过期的 key；间隔小则占用 CPU，间隔大则浪费内存

例如 Redis 每秒处理：
1. 测试随机的 20 个 keys 进⾏行行相关过期检测。
2. 删除所有已经过期的 keys。
3. 如果有多于 25% 的 keys 过期，重复步奏1
Redis 服务器实际使用的是惰性删除和定期删除两种策略：通过配合使用这两种删除策略，服务器可以很好地在合理使用 CPU 时间和避免浪费内存空间之间取得平衡。

惰性删除策略是怎么实现？

通过 expireIfNeeded 函数，当我们操作 key 的时候进行判断 key 是否过期。

定期删除策略是怎么实现的？

通过 activeExpireCycle 函数，serverCron 函数执行时，activeExpireCycle 函数就会被调用，规定的时间里面分多次遍历服务器的 expires 字典随机检查一部分 key 的过期时间，并删除其中的过期 key。
相关阅读:
SQL Server 2008的审核功能
 在SSMS(2008)中对数据库对象进行搜索和筛选
 关于在ASP.NET应用程序中异步调用Web Service的解决方案
 SSIS 2008中的Data Profiler任务
 开始Windows Embedded之旅
 在Access中计算两个日期之间的工作日天数
 当PrintForm遇到"RPC服务不可用的错误”
REST 的知识【转载】
在C#中实现类似Eval这类动态求值的函数【转载】
行内数据
原文地址：https://www.cnblogs.com/jwen1994/p/12264247.html

Redis 持久化原理及过期 key 清除策略

Redis RDB 持久化原理

Redis AOF 持久化原理

Redis 两种持久化方案对比

Redis 过期 key 清除策略