两台服务器, 已经做好了主主复制, 现再用keepalived保证高可用性.
闲话少说, 先在两台服务器都安装keepalived:
yum install keepalived -y
安装成功.
keepalived默认会使用这个配置文件: /etc/keepalived/keepalived.conf
安装好之后会有一个默认的, 我们可以备份一下, 其实不备份也没事
keepalived.conf 使用以下配置:
[root@master1 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak [root@master1 ~]# vim /etc/keepalived/keepalived.conf #清空默认内容,直接采用下面配置: ! Configuration File for keepalived global_defs { router_id mysql1 } vrrp_script chk_mysql_port { #检测mysql服务是否在运行。有很多方式,比如进程,用脚本检测等等 script "/opt/chk_mysql.sh" #这里通过脚本监测 interval 2 #脚本执行间隔,每2s检测一次 weight -5 #脚本结果导致的优先级变更,检测失败(脚本返回非0)则优先级 -5 fall 2 #检测连续2次失败才算确定是真失败。会用weight减少优先级(1-255之间) rise 1 #检测1次成功就算成功。但不修改优先级 } vrrp_instance VI_1 { state BACKUP interface enp0s3 #指定虚拟ip的网卡接口 virtual_router_id 100 #路由器标识,MASTER和BACKUP必须是一致的 priority 101 #定义优先级,数字越大,优先级越高,在同一个vrrp_instance下,MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后,就可以将VIP资源再次抢回来 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.1.222 #设置虚拟IP } track_script { chk_mysql_port } }
global_defs 是全局配置, 主要用来在这台机器上的mysql挂了之后发邮件通知, 不过这里先不用邮件通知的机制. 主要要配置的是router_id, 其实就是一个标识服务器的id, 两台服务器的这个值要不同
vrrp_script 是配置检查mysql是否正常的脚本, 脚本下面会给出
vrrp_instance 是实例, 需要注意的点:
state配成BACKUP表示可以结合nopreemt设置非抢占式, 就是A上的mysql挂了, 则vip会漂到B上去, 等A上的mysql再好了, vip也还是在B上, 要等到B上的mysql挂了, 才会把vip漂到A上去. 认为这种方式比较合理, 没啥好抢的嘛, 都是为用户服务嘛, 抢啥.
interface要配成当前机器的真实ip使用的那个网卡, 比如有时候是eth0, 但是我看了我服务器上的是enp0s3:
virtual_router_id路由器标识,MASTER和BACKUP必须是一致的.
nopreempt设置成非抢占模式, 这个还是不要用的好, 下面解释.
下面给出第二台机器的keepalived配置:
[root@localhost opt]# cat /etc/keepalived/keepalived.conf ! Configuration File for keepalived global_defs { router_id mysql2 } vrrp_script chk_mysql_port { script "/opt/chk_mysql.sh" interval 2 weight -5 fall 2 rise 1 } vrrp_instance VI_1 { state BACKUP interface enp0s3 virtual_router_id 100 priority 97 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.1.222 } track_script { chk_mysql_port } }
可以看到, 两台机器只有router_id和priority不同. 而且两台都设置成了BACKUP, 没有nopreempt.
/opt/chk_mysql.sh脚本:
#!/bin/bash MYSQL=/usr/bin/mysql MYSQL_HOST=localhost MYSQL_USER=c1551 MYSQL_PASSWORD=1qaz@WSX3edc CHECK_TIME=3 #mysql is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0 MYSQL_OK=1 function check_mysql_helth (){ $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1 if [ $? = 0 ] ;then MYSQL_OK=1 else MYSQL_OK=0 fi echo $MYSQL_OK return $MYSQL_OK } while [ $CHECK_TIME -ne 0 ] do let "CHECK_TIME -= 1" check_mysql_helth if [ $MYSQL_OK = 1 ] ; then CHECK_TIME=0 exit 0 fi if [ $MYSQL_OK -eq 0 ] && [ $CHECK_TIME -eq 0 ] then echo 'killing keepalived...' pkill keepalived exit 1 else echo 'not killing keepalived...' fi sleep 1 done
对于抢占和非抢占, 有人是这么说的:
keepalive是基于vrrp协议在linux主机上以守护进程方式,根据配置文件实现健康检查。 VRRP是一种选择协议,它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。 控制虚拟路由器IP地址的VRRP路由器称为主路由器,它负责转发数据包到这些虚拟IP地址。 一旦主路由器不可用,这种选择过程就提供了动态的故障转移机制,这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。 keepalive通过组播,单播等方式(自定义),实现keepalive主备推选。工作模式分为抢占和非抢占(通过参数nopreempt来控制)。 1)抢占模式: 主服务正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不提供服务,备提供服务。 也就是说,工作在抢占模式下,不分主备,只管优先级。 如上配置,不管keepalived.conf里的state配置成master还是backup,只看谁的priority优先级高(一般而言,state为MASTER的优先级要高于BACKUP)。 priority优先级高的那一个在故障恢复后,会自动将VIP资源再次抢占回来!! 2)非抢占模式: 这种方式通过参数nopreempt(一般设置在advert_int的那一行下面)来控制。不管priority优先级,只要MASTER机器发生故障,VIP资源就会被切换到BACKUP上。 并且当MASTER机器恢复后,也不会去将VIP资源抢占回来,直至BACKUP机器发生故障时,才能自动切换回来。 千万注意: nopreempt这个参数只能用于state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式! 也就是说: a)当state状态一个为master,一个为backup的时候,加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的,是抢占模式! b)当state状态都设置成backup,如果不配置nopreempt参数,那么也是看priority优先级决定谁抢占vip资源,即也是抢占模式。 c)当state状态都设置成backup,如果配置nopreempt参数,那么就不会去考虑priority优先级了,是非抢占模式!即只有vip当前所在机器发生故障,另一台机器才能接管vip。即使优先级高的那一台机器恢复 后也不会主动抢回vip,只能等到对方发生故障,才会将vip切回来。
然而我发现, 如果我两个都设置成BACKUP而且启用nopreempt, 而且使用上面的健康检查脚本, 那么, 如果一台机器上的mysql挂了, 虽然健康检查没过, 这台机器上keepalived的priority降低了, 但是, vip还是在这台机器上. 因为上面也说了, 并不会主动抢加vip, 只有这台机器上的keepalived挂了或者直接这台机器挂了, vip才会漂到另外一台机器上!!! WTF!!! 就是说这台机器上的mysql虽然挂了, 但这台机器上的keepalived还是在一边等mysql起来, 同时还是占用了vip的!! 这显然不是我想要的. 所以, 还是不配置nopreempt好了, 让priority降低的机器自动释放vip.
以上.