摘要:Redis-Migrate-Tool(后面都简称RMT),是唯品会开源的redis数据迁移工具,主要用于异构redis集群间的数据在线迁移,即数据迁移过程中源集群仍可以正常接受业务读写请求,无业务中断服务时间。这篇blog主要内容包括工具特性简介、使用方法以及注意的要点。关于实现的原理,可以自行阅读源码理解或者联系我们交流。
目前该项目已经开源在GitHub上(https://github.com/vipshop/redis-migrate-tool 链接入口可点击原文阅读)。
一、RMT特性
1、异构集群相互之间的迁移
支持下面几种异构集群之间的数据迁移和同构集群扩容/缩容。
1)单个redis到twemproxy/cluster迁移;
2)twemproxy到twemproxy/cluster迁移;
3)cluster到twmeproxy/cluster迁移。
2、在线迁移
RMT启动后模拟成redis slave,请求master的全量数据和增量数据。RMT收到数据之后解析成redis协议格式的oplog(写操作),然后发送给目标集群。有两种请求方式,source_safe: true,对于同一ip上的redis,逐个的请求全量数据(RDB);source_safe: false,并行请求同步全量数据。source_safe: false时,需要注意多个源redis所在的同一主机是否有足够的内存 和 RDB 并发落盘时的 IOPS 性能。
3、从AOF 或 RDB恢复数据
如果在线集群数据全部丢失,不要方,RMT可以帮你从备份的 AOF 和 RDB 文件恢复到目标集群。
4、数据过滤
可以过滤算法上不属于源集群的脏数据,比如有人绕过twemproxy,非正常方式直接向后端redis写入数据。还可以在配置文件[common]中使用filter参数,过滤掉不需要的数据。
二、使用方法
下面手把手教你使用 RMT,包括安装、配置、监控还有业务在线切换方式。
1、RMT安装
github开源地址:https://github.com/vipshop/redis-migrate-tool
安装:
生成的执行文件在src目录下,使用"-h"选项查看使用方法。
2、RMT配置文件
RMT的配置主要由三部分组成,数据源[source],目标集群[target],通用配置部分[common]。
RMT对源集群的类型并不敏感,对每个redis节点伪装成一个slave。因而 twemproxy和cluster集群,可以使用 single 和 cluster 类型。建议配置成对应的 twemproxy 或者 cluster类型。有两方面作用:1)RMT在数据迁移时,可以根据 twemproxy(hash)或者cluster(slots)数据分布规则,过滤掉原本不属于该节点的数据;2)当源集群类型是cluster时,只用配置一个节点,简化配置。
目标集群,因为不同数据分布规则需要执行不同的写入逻辑,因而配置非常严谨。特别是tw集群,迁移到目标集群的server配置需要和twemproxy中保持一致,包括hash算法、数据分布算法、节点的ip和port、权重、节点的名字。
部分配置下面会详细讲解,完整配置请参考github(https://github.com/vipshop/redis-migrate-tool#configuration)。
2.1、redis/twemproxy到twemproxy
[source]和[taget] 由集群类型type和redis节点server组成。[source] type可以支持single/twemproxy/cluster/aof file/rdb file 五种类型。[target]中的type支持single/twemproxy/cluster/rdb file 四种类型。
对于twemproxy集群,必须设置 hash、distribution、servers等参数,而且和目标集群的twemproxy一模一样(敲黑板)。前几天,有某站公司的朋友问,RMT迁移之后,存在数据读取不到,0.0。了解之后,发现是 target部分和twemproxy配置不一致导致。这也是写这篇 使用文档初衷和动力,怕坑到更多使用这个开源软件的朋友。
在[common]中,一些参数主要作用如下,其他参数参考GitHub(https://github.com/vipshop/redis-migrate-tool#common)
2.2、cluster集群到cluster集群迁移
[source] 和 [target]只需配置集群的一个节点。当然[source]部分cluster也可以配置成如下形式。
2.3、cluster到twemproxy的迁移
twemproxy 到 cluster的迁移,作为练习题,你们自己测试吧
2.4、从AOF 和 RDB中恢复数据
3、RMT迁移
使用下面的命令就可以开始迁移数据
4、观察迁移状态
使用redis-cli可以连接 rmt.conf 中配置的端口,执行info命令,就可以观察迁移的状态。
total_msgs_outqueue可以判断是否有oplog在队列中等待处理,如果total_msgs_outqueue>0,请继续等待。
5 RMT检验源集群和目标集群的差异
在业务切换到目标服务器之前,可使用 RMT 抽样检查数据的一致性,默认抽样1000个key。
6 如何完成业务切换?
如果是异构集群的迁移,更改redis驱动/客户端和修改代码,重新发布是必然的事情。如果是同构集群,做配置发布就可以。如果没有做重启发布,等待源集群没有连接之后,可以关闭RMT进程(kill)。或者重启应用,强制断开长连接。
三、注意事项
1、重要的事说三遍,RMT迁移数据到twemproxy,需要保持rmt.conf 中 [target] hash、distribution、servers 三个参数和目标集群的twemproxy配置严格一致。
2、迁移中和业务切换之前,请反复观察“-o rmt.log”日志信息,确认是否有异常。
3、业务切换之前,请充分检查,特别是数据的一致性。
4、RMT 建议部署在单独空闲机器上,同目的集群在同一个网段(跨机房迁移数据,可以提高迁移速度)。千万不要部署在源集群所在的机器,防止资源不足,比如内存,带宽,IOPS。
5、注意RDB传输是否超时;
6、redis client buf中的slave项,设置足够大的buffer size和超时时间。