一、Sentinel说明
在主从复制中,master 挂掉了,那么整个就崩掉了,因为 slave 不能写数据。
所以哨兵的作用就是让 Redis 的主从复制高可用
在 master 挂掉后,Sentinel 在选一个 slave 当做 master,就算之前的那个 master 启动起来了,也只能当 slave。
工作流程:
- 多个 Sentinel 发现并确认 master 有问题
- 选举一个 Sentinel 作为领导
- 选取一个 slave 作为新的 master
- 通知其余 slave 成为新的 master 的 slave
- 通知客户端主从变化
- 等待老的 master 复活成为新的 master 的 slave
二、配置
1、这里以一主两从的形式配置,以三个进程的方式演示,先启动三个 Redis 配置如下:
主配置文件
pidfile /var/run/redis.pid
dir "/root/redis/data"
logfile "6379.log"
daemonize yes
port 6379
从配置文件1
pidfile /var/run/redis2.pid
dir "/root/redis/data2"
logfile "6380.log"
daemonize yes
port 6380
slaveof 127.0.0.1 6379
slave-read-only yes
从配置文件2
pidfile /var/run/redis3.pid
dir "/root/redis/data3"
logfile "6381.log"
daemonize yes
port 6381
slaveof 127.0.0.1 6379
slave-read-only yes
启动三个Redis
redis-server redis_6379.conf
redis-server redis_6380.conf
redis-server redis_6381.conf
2、搭建哨兵,哨兵也可以当做一个 Redis 服务器,分别创建三个哨兵配置文件:sentinel_26379.conf sentinel_26380.conf sentinel_26381.conf
配置文件:sentinel_26379.conf
port 26379
daemonize yes
dir "/root/redis/sentinel_data"
protected-mode no
bind 0.0.0.0
logfile "redis_sentinel.log"
sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000
配置文件:sentinel_26380.conf
port 26380
daemonize yes
dir "/root/redis/sentinel2_data"
protected-mode no
bind 0.0.0.0
logfile "redis_sentinel2.log"
sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000
配置文件:sentinel_26381.conf
port 26381
daemonize yes
dir "/root/redis/sentinel3_data"
protected-mode no
bind 0.0.0.0
logfile "redis_sentinel3.log"
sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000
启动三个哨兵
redis-sentinel sentinel_26379.conf
redis-sentinel sentinel_26380.conf
redis-sentinel sentinel_26381.conf
3、哨兵更多配置参数
sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000
sentinel monitor <master-name> <ip> <redis-port> <quorum>
# 告诉sentinel去监听地址为ip:port的一个master,这里的master-name可以自定义,quorum是一个数字,指明当有多少个sentinel认为一个master失效时,master才算真正失效
sentinel auth-pass <master-name> <password>
# 设置连接master和slave时的密码,注意的是sentinel不能分别为master和slave设置不同的密码,因此master和slave的密码应该设置相同。
sentinel down-after-milliseconds <master-name> <milliseconds>
# 这个配置项指定了需要多少失效时间,一个master才会被这个sentinel主观地认为是不可用的。 单位是毫秒,默认为30秒
sentinel parallel-syncs <master-name> <numslaves>
# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,这个数字越小,完成failover所需的时间就越长,但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
sentinel failover-timeout <master-name> <milliseconds>
"""
failover-timeout 可以用在以下这些方面:
1. 同一个sentinel对同一个master两次failover之间的间隔时间。
2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
3.当想要取消一个正在进行的failover所需要的时间。
4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了。
"""
三、python客户端连接哨兵
import redis
from redis.sentinel import Sentinel
# 连接哨兵服务器(主机名也可以用域名)
sentinel = Sentinel([('127.0.0.1', 26379),
('127.0.0.1', 26380),
('127.0.0.1', 26381)
],
socket_timeout=5)
print(sentinel)
# 获取主服务器地址
master = sentinel.discover_master('mymaster')
print(master)
# 获取从服务器地址
slave = sentinel.discover_slaves('mymaster')
print(slave)