【数据库】Redis(6)--Redis主从复制

【数据库】Redis(6)--Redis主从复制
1.1.Redis主从复制概念

概念

主从复制，是指将一台Redis服务器的数据，复制到其它的Redis服务器，前者称为主节点(master/leader)，后者称为从节点(slave/follower)；数据的复制是单向的，只能由主节点到从节点。Master以写为主，Slave以读为主。

默认情况下，每台Redis服务器都是主节点；且一个主节点可以有多个从节点（或没有从节点），但一个从节点只能有一个主节点。

主从复制的作用主要包括：

1.数据冗余：主从复制实现了数据的热备份，是持久化之外的一种数据冗余方式。

2.故障恢复：当主节点出现问题时，可以由从节点提供服务，实现快速的故障恢复；实际上是一种服务的冗余。

3.负载均衡：在主从复制的基础上，配合读写分离，可以由主节点提供写服务，由从节点提供读服务（即写Redis数据时应用连接主节点，读Redis数据时应用连接从节点），分担服务器负载；尤其是在写少读多的场景下，通过多个节点分担读写负载，可以大大提高Redis服务器的并发量。

4.高可用基石：除了上述作用以外，主从复制还是哨兵和集群能够实施的基础，因此说主从复制是Redis高可用的基础。

一般来说，要将Redis运用于工程项目中，只使用一台Redis是万万不能的，原因如下：

1.从结构上，单个Redis服务器会发生单点故障，并且一台服务器需要处理所有的请求负载，压力较大；

2.从容量上，单个Redis服务器内存容量有限，就算一台Redis服务器内存容量为256G，也不能将所有内存用作Redis存储内存，一般来说，单台Redis最大使用内存不应该超过20G；

主从复制，读写分离，80%的情况下都是在进行读操作，减缓服务器的压力，架构中经常使用，一主二从。

1.2.环境配置

Redis默认单机启动之后就是master，主从复制只需要配置从库，不用配置主库。
```
127.0.0.1:6379> info replication  #查看当前库的信息
# Replication
role:master  #显示当前server的角色  master
connected_slaves:0  # 显示从机的个数
master_repl_offset:0
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
```
这里实际项目中都是部署在同一网段的不同服务器上，这里只做简单说明配置，需要在另外的服务器上去创建两个从机Redis slave从机。具体需要修改的是redis.conf文件中的如下配置：
```
port 6379 #端口号
logfile "6379.log" #log日志文件存放位置
dbfilename dump6379.rdb  #redis持久化存放目录
```
其它从机的redis.conf文件配置一致即可。

1.3.配置一主二从

默认情况下，每台Redis服务器都是主节点；我们一般情况下只用配置从机就可以了。

认老大，就是一台作为主机（79）二台作为从机（80/81）

具体配置如下：
```
127.0.0.1:6380> SLAVEOF 127.0.0.1:6379 #手动使用命令方式选择6379作为自己的老大
OK
127.0.0.1:6380> info relication
# Replication
role:slave  #当前角色是从机
master_host:127.0.0.1
master_port:6379
master_link_status:up
master_last_io_seconds_ago:3
master_sync_in_progress:0
slave_repl_offset:14
slave_read_only:1
connected_slaves:0
```
对应主机端可以看到从机的状态如下：

真实的主从配置应该是在配置文件中配置，这样的话是永久的，这里使用slaveof命令只是暂时的。

在redis.conf文件中我们需要配置replicaof，设置masterip地址和端口号；如果主机有密码，那么配置matserauth 对应的密码即可。

细节

主从配置默认是主机可以写，从机不能写只能读取。主机中的所有信息和数据，都会被从机保存。

即在从机中只能读取到主机中设置的key的值，而不能进行set key值操作。

如果是使用命令行，来配置的主从，这个时候如果重启了，就会便会主机。只要变为从机，立马就会从主机中获取值。

原理

Slave启动成功连接到master后会发送一个sync同步命令

Master接到命令，启动后台的存盘进程，同时收集所有收到的用于修改数据集命令，在后台进程执行完毕之后，master将传送整个数据文件到slave，并完成一次同步。

全量复制：slave服务在接收到数据库文件数据后，将其存盘并加载到内存中；

增量复制：master继续将新的所有收集到的修改命令依次传给slave，完成同步。

但是只要是重新连接master，一次完全同步（全量复制）将被自动执行。我们的数据一定可以在从机中看到。

手动版谋朝篡位

如果主机断开了连接，我们可以使用SLAVE no one命令，让自己变成主机，其它的节点就可以手动连接到最新的这个主节点（手动版）。如果这个时候老大修复了，那就重新连接。

1.4.Redis哨兵模式

简单地说Redis哨兵模式，就是自动选举老大的模式。

概述

主从切换技术的方法是：当主服务器宕机后，需要手动把一台服务器切换为主服务器，这就需要人工干预，费事费力，还会造成一段时间内服务不可用。这不是一种推荐的方式，更多时候，我们优先考虑哨兵模式，Redis从2.8开始正式提供了Sentinel（哨兵）架构来解决这个问题。

谋朝篡位的自动版，能够后台监控主机是否故障，如果故障了根据投票数自动将从库换成主库。

哨兵模式是一种特殊的模式，首先Redis提供了哨兵的命令，哨兵是一个独立的进程，作为进程，它会独立运行，其原理是哨兵通过发送命令，等待Redis服务器响应，从而监控运行的多个Redis实例。

这里哨兵有两个作用：
- 通过发送命令，让Redis服务器返回监控其运行状态，包括主服务器和从服务器。
- 当哨兵监测到master宕机，会自动将slave切换成master，然后通过发布订阅模式通知其它的从服务器，修改配置文件，让它们切换主机。
  
  然而一个哨兵进程对Redis服务器进行监控，可能会出现问题，为此，我们可以使用多个哨兵进行监控。各个哨兵之前还会进行监控，这样就形成了多哨兵模式。
假设主服务器宕机，哨兵1先检测到这个结果，系统并不会马上进行failover过程，仅仅是哨兵1主观的认为主服务器不可用，这个现象称为主观下线。当后面的哨兵也检测到主服务器不可用，并且数量达到一定值时，那么哨兵之间就会进行一次投票，投票的结果由一个哨兵发起，进行failover[故障转移]操作。切换成功后，就会通过发布订阅模式，让各个哨兵把自己监控的从服务器实现切换主机，这个过程称为客观下线。

测试

我们目前的状态是一主二从

1.配置哨兵配置文件sentinel.conf
```
# sentinel monitor 被监控的名称 host port 1
sentinel monitor myredis 127.0.0.1 6379 1
```
后面的数字1，代表主机挂了，slave投票看让谁接替成为主机，票数最多的，就会成为主机。

2.启动哨兵
```
[root@fengye bin]# redis-sentinel fconfig/sentinel.conf
```
如果Master节点断开了，这个时候就会从从机中随机选择一个服务器（这里面有一个投票算法）。

这里如果主机此时回来了，只能归并到新的主机下，当做从机。这就是哨兵模式的规则。

哨兵模式

优点：

1.哨兵集群，基于主从复制模式，所有的主从配置优点，它全有。

2.主从可以切换，故障可以转移，系统的可用性就会更好。

3.哨兵模式就是主从模式的升级，手动到自动，更加健壮。

缺点：

1.Redis不好在线扩容的，集群容量一旦达到上限，在线扩容就十分麻烦。

2.实现哨兵模式的配置其实是很麻烦的，里面有很多选择。

1.5.哨兵模式配置

哨兵模式的全部配置
```
# Example sentinel.conf

# 哨兵sentinel实例运行的端口 默认26379，如果有哨兵集群，还需要配置每个哨兵端口
port 26379

# 哨兵sentinel的工作目录
dir /tmp

# 哨兵sentinel监控的redis主节点的 ip port
# master-name 可以自己命名的主节点名字 只能由字母A-Z、数字0-9、这三个字符".-_"组成。
# quorum配置多少个sentinel哨兵统一认为master主节点失联，那么这时客观上认为主节点失联了
# sentinel monitor <master-name> <ip> <redis-port> <quorum>
sentinel monitor mymaster 127.0.0.1 6379 2

# 当在Redis实例中开启了requirepass foobared 授权密码，这样所有连接Redis实例的客户端都是需要提供密码
# 设置哨兵sentinel，连接主从的密码，注意必须为主从设置一样的验证密码
# sentinel auth-pass <master-name> <password>
sentinel auth-pass mymaster MYSUPER--secret-0123passw0rd

# 指定多少毫秒之后，主节点没有应答哨兵sentinel，此时，哨兵主观上认为主节点下线，默认30秒
# sentinel down-after-milliseconds <master-name> <milliseconds>
sentinel down-after-milliseconds mymatser 30000

# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行同步
这个数字越小，完成failover所需的时间就越长，但是如果这个数字越大，越意味着越多的slave因为replication而不可用。可以通过将这个值设为1来保证每次只有一个slave处于不能处理命名请求的状态。
# sentinel parallel-syncs <master-name> <numslaves>
sentinel parallel-syncs mymaster 1

# 故障转移的超时时间，failover-timeout，可以用在以下这些方面：
# 1.同一个sentinel对同一个master两次failover之间的间隔时间
# 2.当一个slave从一个错误的master那里同步数据开始计算时间，直到slave被纠正为向正确的master那里同步数据时
# 3.当想要取消一个正在进行的failover所需要的时间
# 4.当进行failover时，配置所有slaves指向新的master所需的最大时间。不过，即使过了这个超时，slaves依然会被正确配置为指向master，但是就不按parallel-syncs所配置的规则来了
# 默认三分钟
# sentinel failover-timeout <master-name> <milliseconds>
sentinel failover-timeout mymaster 180000

# SCRIPTS EXECUTION

# 配置当某一事件发生时所需要执行的脚本，可以通过脚本来通知管理员，例如当系统运行不正常时发邮件通知相关人员。
# 对于脚本的运行结果有以下规则：
# 若脚本执行后返回1，那么该脚本稍后将会被再次执行，重复次数目前默认为10
# 若脚本执行后返回2，或者比2更高的一个返回值，脚本将不会重复执行
# 如果脚本在执行过程中由于收到系统中断信号被终止了，则同返回值为1时的行为相同
# 一个脚本的最大执行时间为60s，如果超过这个时间，脚本将会被一个SIGKILL信号终止，之后重新执行

1).sentinel notification-script <master-name> <script-path> 

# 通知型脚本:当sentinel有任何警告级别的事件发生时（比如说redis实例的主观失效和客观失效等等），将会去调用这个脚本，这时这个脚本应该通过邮件，SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时，将传给脚本两个参数，一个是事件的类型，一个是事件的描述。如果sentinel.conf配置文件中配置了这个脚本路径，那么必须保证这个脚本存在于这个路径，并且是可执行的，否则sentinel无法正常启动成功。

# 通知脚本
# sentinel notification-script <master-name> <script-path>
sentinel notification-script mymaster /var/redis/notify.sh

# 客户端重新配置主节点参数脚本
# 当一个master由于failover而发生改变时，这个脚本将会被调用，通知相关的客户端关于master地址已经发生改变的信息
# 以下参数将会在调用脚本时传给脚本：
# <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>
# 目前<state>总是"failover"
# <role>是"leader"或者"observer"中的一个
# 参数from-ip，from-port，to-ip，to-port是用来和旧的master和新的master(即旧的slave)通信的
# 这个脚本应该是通用的，能被多次调用的，不是针对性的
# sentinel client-reconfig-script <master-name> <script-path>
sentinel client-reconfig-script mymaster /var/redis/reconfig.sh
```
相关阅读:
120.三角形最短路径（leetcode）
Python Pycharm中灵活运用debugger
POJ 1284
POJ 2407
POJ 1811
HDU 1164
HDU 4228
HDU 2521
HDU 4133
ZOJ 2562 反素数
原文地址：https://www.cnblogs.com/yif0118/p/15221393.html

【数据库】Redis(6)--Redis主从复制

1.1.Redis主从复制概念

1.2.环境配置

1.3.配置一主二从

1.4.Redis哨兵模式

1.5.哨兵模式配置