一、什么是RDB持久化
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存中里。redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束,再用这个临时文件替换上次持久化的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能,如果需要进行大规模数据恢复,且对于数据恢复的完整性不是特别敏感,那RDB方式要比AOF方式更加高效。RDB的缺点是最后一次持久化后的数据可能丢失。
二、fork
fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
三、快照(snapshotting)
1、save save 秒钟 写操作次数 默认的是:
save 60 10000
save 300 10
save 900 1
save “ ” 禁用持久化
2、stop-writes-on-bgsave-error (后台save出错的时候,是否禁止写操作。如果配置成no,表示不在乎数据的一致性或者有其他的手段发现和控制)
3、rdbcompression(是否压缩)
对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话,redis会采用LZF算法进行压缩。如果不想消耗CPU来进行压缩,可以设置为关闭此功能。
4、rdbchecksum
在存储快照后,还可以让redis使用CRC64算法来进行数据校验,但是这样会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。
四、如何触发RDB快照
1、配置文件中默认的快照配置。(save 60 10000)
2、命令save或者bgsave。save时只管保存,其他不管,全部阻塞;bgsave:redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。可以通过lastsave命令获取最后一次成功执行快照时间。
3、执行flushall命令,也会产生dump.rdb文件,但是里面是空的,无意义。
五、优势和劣势
优势:适合大规模的数据恢复、对数据完整性和一致性要求不高
劣势:在一定间隔时间做一次备份,如果redis意外down掉的话,就会丢失最后一次快照后所有的修改。fork的时候,内存中的数据被克隆一份,大致2倍的膨胀性需要考虑。