• redis代理对比,redis架构对比,redis predixy安装和功能测试


    【0】代理功能与性能对比

    目前市面上主流的代理包含:predixy、twemproxy、codis、redis-cerberus四款,这四款各有各的优势,我们逐个对比进行对比分析。

    如上图,我们发现 twemproxy / codis 都不支持 redis-cluster,所以我们放弃使用;(但业界 codis 用的挺多的)

    性能测试报告 2017:https://blog.csdn.net/rebaic/article/details/76384028

    性能测试测试报告 2020:https://github.com/netease-im/camellia/blob/master/docs/redis-proxy/performance-report-8.md

    redis架构发展:https://www.cnblogs.com/crazymakercircle/p/14282108.html

    【1】predixy的安装和配置

    【1.1】基本介绍

    predixy 是高性能的适用于 redis 集群和哨兵的代理。

    predixy github 地址:https://github.com/joyieldInc/predixy

    predixy 编译安装需要 C++11 版本的编译器,至少需要 CentOS 7及以上版本才能编译安装。

    对于 CentOS 6或更低版本,可以直接使用在 github release 中的二进制版本。

    【1.2】特性、优点

    • 同并轻量级
    • 支持多线程
    • 多平台支持:Linux、OSX、BSD、Windows( Cygwin )
    • 支持Redis Sentinel,可配置一组或者多组redis
    • 支持Redis集群
    • 支持redis多种类型的命令,包括blpop、brpop、brpoplpush
    • 支持扫描命令,无论是单个redis还是多个redis实例都支持
    • 多键命令支持:mset/msetnx/mget/del/unlink/touch/exists
    • 支持redis的多数据库,即可以使用select命令
    • 支持事务,当前验证于Redis Sentinel下组redis组可用
    • 支持脚本,包括命令:script load、eval、evalsha
    • 支持发布订阅机制,也即Pub/Sub系列命令
    • 多数据中心支持,删除支持
    • 扩展的AUTH命令,部分的读、写、管理权限控制机制,健空间限制机制
    • 日志可按级别输出,记录日志被io实时记录
    • 日志文件可以按时间、大小自动切分
    • 大量的统计信息,包括CPU、内存、请求、响应等信息
    • 延迟监控信息,可以看到整体延迟,分秒还原事件延迟

    【2】安装

    【2.1】下载解压

    tar -xzf predixy-1.0.5-bin-amd64-linux.tar.gz

    mv predixy-1.0.5 /data/redis/

    cd /data/redis/predixy-1.0.5/conf/

    【2.2】修改配置文件 cluster.conf

    配置文件官方说明:https://github.com/joyieldInc/predixy/blob/master/doc/config_CN.md

    predixy 支持多种架构,由于使用的是 redis cluster,只需配置 redis cluster 对应的配置文件cluster.conf 即可。

    内容如下:

    ##ClusterServerPool {

    ## [Password xxx] #default no

    ## [MasterReadPriority [0-100]] #default 50

    ## [StaticSlaveReadPriority [0-100]] #default 0

    ## [DynamicSlaveReadPriority [0-100]] #default 0

    ## [RefreshInterval number[s|ms|us]] #default 1, means 1 second

    ## [ServerTimeout number[s|ms|us]] #default 0, server connection socket read/write timeout

    ## [ServerFailureLimit number] #default 10

    ## [ServerRetryTimeout number[s|ms|us]] #default 1

    ## [KeepAlive seconds] #default 0, server connection tcp keepalive

    # Examples:

    ClusterServerPool {

    Password 123456

    MasterReadPriority 60

    StaticSlaveReadPriority 50

    DynamicSlaveReadPriority 50

    RefreshInterval 1

    ServerTimeout 1

    ServerFailureLimit 10

    ServerRetryTimeout 1

    KeepAlive 120

    Servers {

    + 192.168.191.176:6381

    + 192.168.191.176:6382

    + 192.168.191.211:6383

    + 192.168.191.211:6384

    + 192.168.191.70:6385

    + 192.168.191.70:6386

    }

    }

    参数说明:

    MasterReadPriority,StaticSlaveReadPriority,DynamicSlaveReadPriority 三个参数和 redis 本身配置文件中的 slave-priority 没任何关系的。

    如果是自动发现找到的节点,则 DynamicSlaveReadPriority 会起作用,如果是直接配置的节点,则 StaticSlaveReadPriority 会起作用。

    Master/SlaveReadPriority

    Master

    Slave1

    Slave2

    Fail-over notes

    60/50

    all requests

    0 requests

    0 requests

    Master dead, read requests deliver to slave until master(maybe new master) alive

    60/0

    all requests

    0 requests

    0 requests

    Master dead, all requests fail

    50/50

    all write requests, 33.33%read requests

    33.33% read requests

    33.33% read requests

    -

    0/50

    all write requests, 0 read requests

    50% read requests

    50% read requests

    all slaves dead, all read requests fail

    10/50

    all write requests, 0 read requests

    50% read requests

    50% read requests

    all slaves dead, read requests deliver to master

    RefreshInterval : predixy 获取节点信息和集群 hash slot 集群信息的间隔

    ServerFailureLimit : predixy 停止路由到节点之前失败的次数

    ServerTimeout : 单个命令执行的超时时间

    Password: 指定连接redis实例默认的密码,不指定的情况下表示redis不需要密码

    【2.3】集群自动发现

    在 Servers 部分配置集群中任意一个节点即可,predixy 会自动发现整个集群的信息,即使配置的节点挂掉后,predixy 代理仍然可正常工作。

    通过自动发现集群,可以减少 cluster.conf 配置文件的修改及对 predixy 的重启操作。

    但 predixy 无法删除曾经自动发现的节点,如果某节点下掉,predixy 仍会看到之前的节点,虽然不影响正常使用,日志则会不断报出错误信息。需重启 predixy 解决。

    【2.4】配置 predixy.conf

    Name Predixy001

    Bind 0.0.0.0:7617

    WorkerThreads 4

    ClientTimeout 300

    Log /data/redis/predixy-1.0.5/predixy.log

    LogRotate 1d

    LogRotate 200M

    Include cluster.conf

    注意 Include 部分,只需包括 cluster.conf,其他的则注释掉,否则可能会影响到 predixy的使用。

    基本配置文件说明:

    • predixy.conf,整体配置文件,会引用下面的配置文件
    • cluster.conf,用于Redis Cluster时,配置后端redis信息
    • sentinel.conf,用于Redis Sentinel时,配置后端redis信息
    • auth.conf,代理中心访问权限控制配置,可以定义多个验证密码,可每个密码指定读、写、管理权限,以及定义可访问的健空间
    • dc.conf,多数据中心支持,可以定义读写分离规则,读流量权重分配
    • latency.conf, 延迟监控规则定义,可以指定需要监控的命令以及延时时间间隔
    • command.conf,自定义命令扩展,用于命令扩展,支持redis 的插件以及自定义数据处理函数等
    • standalone.conf,使用单击模式的redis配置

    【2.5】启动predixy

      cd /data/redis/predixy-1.0.5/bin/

      cp predixy /data/redis/bin/ #我的redis 启动命令在这里,已添加进环境比那里

    启动

    看情况任选一即可

    nohup predixy /data/redis/predixy-1.0.5/conf/predixy.conf &

    nohup predixy /data/redis/predixy-1.0.5/conf/predixy.conf >/data/redis/predixy-1.0.5/predixy.log 2>&1 &

    查看日志

    tail -f /data/redis/predixy-1.0.5/predixy.log

    如上,我们可以看到,由于配置文件 predixy.conf 配置的确是启动了4个进程,所以我们4个线程都就绪连接到集群所有机器了;对应构建连接池

    predixy 添加环境变量

    在 /etc/profile 中添加,然后在 /etc/rc.local 中设置开机启动 ,任选一即可

    echo 'nohup predixy /data/redis/predixy-1.0.5/conf/predixy.conf &' >> /etc/rc.local

    nohup predixy /usr/local/predixy-1.0.5/conf/predixy.conf > /data/redis/predixy-1.0.5/predixy.log 2>&1 &

    【3】连接核验

    代理连接,直接连 7617 端口就行

    redis-cli -p 7617 info

    可以看到 mget mset 都是没有问题的

    同时代理日志信息如下:

    我们通过集群的方式连接,发现key 什么的确实过去了

    【4】故障转移测试

    【4.1】关闭一个主库

    redis-cli -h 192.168.191.70 -p 6385 -a 123456 shutdown

    tail -f /data/redis/predixy-1.0.5/predixy.log

    我们可以发现,b2 之前是在 6385

    故障转移之后,6382 从库,经过故障转移接替 6385 成为主库;

    我们继续连接代理查询:

    如上图,安稳查询那么,证明故障转移是可以的;程序连接的代理,不会感知到任何东西;

    同时我们查看代理日志:

    看这,和炸街了一样,一直报;

    这就如同【2.3】说的

      在 Servers 部分配置集群中任意一个节点即可,predixy 会自动发现整个集群的信息,即使配置的节点挂掉后,predixy 代理仍然可正常工作。

      通过自动发现集群,可以减少 cluster.conf 配置文件的修改及对 predixy 的重启操作。

      但 predixy 无法删除曾经自动发现的节点,如果某节点下掉,predixy 仍会看到之前的节点,虽然不影响正常使用,日志则会不断报出错误信息。需重启 predixy 解决。

    我们连接代理,在 info 中可以发现:

      该配置信息依然在,但其状态 CurrentIsFail:1

    总结:

    代理可用,集群正常故障转移,程序无感;

    运维问题:日志会一直报错;forget 也没用

    【4.2】下掉一个从节点

    我们下一个从节点看看;

    我们下掉6383吧;

    redis-cli -h 192.168.191.211 -p 6383 -a 123456 shutdown

    查看代理日志:

    会一直报错,连不上6383,直到去掉配置文件中的这个实例,重启代理

    总结:

    代理可用,集群正常故障转移,程序无感;

    运维问题:日志会一直报错;forget 也没用

    【4.3】关闭没有从库的主库(彻底关闭一对主从)

    我们关闭 6386和6383这对主从吧,看看代理这时候会发生什么;

    redis-cli -h 192.168.191.211 -p 6383 -a 123456 shutdown

    redis-cli -h 192.168.191.70 -p 6386 -a 123456 shutdown

    我们可以看到,现在redis-cluster 已经有问题了;

    我们看看代理操作是什么情况;

    我们发现是不能访问的!

    集群参数:

    集群参数也是没一个开的;

    【4.4】代理下的集群参数测试,非全slot 可用性

    我们这里就不测那么多了,测一个即可,节点先启动回去

    然后我们测试 cluster-allow-reads-when-down yes 这个参数吧

    redis-cli -h 192.168.191.176 -p 6381 -a 123456 config set cluster-allow-reads-when-down yes

    redis-cli -h 192.168.191.176 -p 6382 -a 123456 config set cluster-allow-reads-when-down yes

    redis-cli -h 192.168.191.211 -p 6383 -a 123456 config set cluster-allow-reads-when-down yes

    redis-cli -h 192.168.191.211 -p 6384 -a 123456 config set cluster-allow-reads-when-down yes

    redis-cli -h 192.168.191.70 -p 6385 -a 123456 config set cluster-allow-reads-when-down yes

    redis-cli -h 192.168.191.70 -p 6386 -a 123456 config set cluster-allow-reads-when-down yes

    然后继续关闭 6383 6386 一对主从的实例

    redis-cli -h 192.168.191.211 -p 6383 -a 123456 shutdown

    redis-cli -h 192.168.191.70 -p 6386 -a 123456 shutdown

    然后我们看看代理,是否可以如之前测试那样,对现有key 是可以访问的;

    我们发现,确实是这样; 直连集群也是如此;

    我们上主库实例上去把开关打开;仅剩的 2个 主库 全都开启这个参数;

    直接连redis-cluster集群上稳稳的是可以set 了; 如下图:

    代理上也可以了 对现有 存在的 slot 的操作、不存在的key 也可以创建了;如下图:

    代理日志,一直报,这是常态了,如下图

    【5】集群水平扩展、收缩测试

    【5.1】新增主节点

    (1)新增 6387 主节点

    redis-cli --cluster add-node 192.168.191.82:6387 192.168.191.176:6381 -a 123456

    (2)自动平衡分配slot 给新空主节点 6387

    redis-cli --cluster rebalance --cluster-use-empty-masters 192.168.191.176:6381 -a 123456

    (3)check 一下看看现在的集群信息

    (4)检查代理日志

    如下图:

    我们可以发现,新加入的主节点已经被自动发现且识别出来了;

    (5)使用代理操作、查阅验证

    我们用代理 mset 一下

    如下图,我们连接redis-cluster 查阅验证,可以发现新的 key 的get set 已经完成,并且新的key 也分配到了 新加的主库 6387

    如下图,我们连接代理,使用Info 查看也可以看到该主库了,由于代理开了4个线程,所以现在的连接数是4,且如果线程不挂,一般会一直保持 connections为4的;

    (6)结论

    没有任何问题啊,就真如redis-cluster 一样

    【5.2】新增从节点

    redis-cli --cluster add-node 192.168.191.82:6388 192.168.191.176:6381 --cluster-slave -a 123456

    如下图:加入成功

    如下图:我们可以看到,代理自动识别出来了新的,木有问题啊

    要是挂掉它,我们可以发现,代理的日志依然是会一直报,这表示只要有节点加入进来了,不管你是forget 还是 del-node,也不管你是否是 cluster.conf 文件中配置的集群ip;

    反正只要是集群自动发现加入过的,它都会报;如果要去掉,只能重启代理

    【5.3】删除一主一从,缩容

    先删除从库:

    redis-cli --cluster del-node 192.168.191.176:6381 45a9ea5062479aaad68b6a9c4b5cc1942639dcb4 -a 123456

    再删主库:

    (1)迁移被删除主库上的 slot

    把槽位平均非给其他主节点

    redis-cli -a 123456 --cluster rebalance --cluster-weight

    11ac5cf5004f22a55ee0afa2b221d120ad768f7d=1 f5dc23c602b57f6b09b4909d01289ff4d80220ed=1

    4ba0958a0c9aa944962182673058fbc4c27952eb=1 4dfde05a131e9b8900553ef03ef41703737e449f=0

    192.168.191.176:6381

    (2)把节点从群集中移除,删除主节点

    redis-cli -a 123456 --cluster del-node 192.168.191.176:6381 4dfde05a131e9b8900553ef03ef41703737e449f

    (3)查看代理:

    查看代理日志,如下图:

    发现,居然没有报错(删除节点,但节点实例未关闭,所以它并没有报错,依然会连接该实例)

    代理查看:

    发现这2个都还在,这证明了,代理不会自动更新集群状态的删除信息,它只会自动更新新增的集群节点信息;

    关闭这 6387 6388 实例;

    我们发现,连不上又报错了;

    【5.4】代理因为删除节点报错问题解决:重启代理

    关闭:kill 进程

    自动:predixy /data/redis/predixy-1.0.5/conf/predixy.conf &

    重启后,报错信息没了;

    登录代理:info 中的信息也更新了

    6387 和 6388 实例就不见了;恢复正常;

    【6】读写分离与读负载均衡的测试

    Master/SlaveReadPriority

    Master

    Slave1

    Slave2

    Fail-over notes

    60/50

    all requests

    0 requests

    0 requests

    Master dead, read requests deliver to slave until master(maybe new master) alive

    60/0

    all requests

    0 requests

    0 requests

    Master dead, all requests fail

    50/50

    all write requests, 33.33%read requests

    33.33% read requests

    33.33% read requests

    Master dead,read requests deliver to slave

    0/50

    all write requests, 0 read requests

    50% read requests

    50% read requests

    all slaves dead, all read requests fail

    10/50

    all write requests, 0 read requests

    50% read requests

    50% read requests

    all slaves dead, read requests deliver to master

    如下:我们现在的架构是

    6382=>6385 ,6384=>6381 ,6386=>6383

    【6.1】60/50 Master/SlaveReadPriority

    现在的架构是:

    6382=>6385 ,6384=>6381 ,6386=>6383

    6350中,只有Ping

    如上图,我们发现,发送了5次 a,5次 a 全在主库 6382;所以证明我们之前 60/50 的结论是正确的;

    那么我们之前全是这种模式,就不做故障转移测试了,可以直接得出结论了;

    结论:

    所有的请求,都会发送给主库;

    当主库宕机,故障转移期间,读操作会发送给从库;(也会尝试连接主库,连几次无果到阈值后读请求发送到从库)

    新主库产生后,所有的请求发给新主库;

    【6.2】60/0 Master/SlaveReadPriority

    修改 cluster.conf 参数

    MasterReadPriority 60

    StaticSlaveReadPriority 0

    DynamicSlaveReadPriority 0

    重启:

    现在的架构是:

    6382=>6385 ,6384=>6381 ,6386=>6383

    关闭 6382主库:

    redis-cli -h 192.168.191.176 -p 6382 -a 123456 shutdown

    如下:

    我们发现故障转移期间,无法访问 a;等故障转移完毕,从库变成主库,就可以访问了;

    结论:

    所有的请求,都会发送给主库;

    当主库宕机,故障转移期间,所有请求都会失败;

    新主库产生后,所有的请求发给新主库;

    【6.3】50/50

    现在的架构是:

    6382=>6385 ,6384=>6381 ,6386=>6383

    如上面3个图,我们发现真的 50 50 读负载均衡了;

    关闭 6382主库:

    redis-cli -h 192.168.191.176 -p 6382 -a 123456 shutdown

    如上图,我们可以发现,关闭 6382 主库之后,没有任何影响,之前在故障转移切换瞬间失败了一次;

    如下图,关闭 6382 ,命令一发起它就收不到任何请求了;

    如下图:6385实例的监控,我们发现主库挂了,从库还没有故障转移切换成主库时,read操作依然请求过来了;

    结论:

    读请求平均分发给所有的主从;

    当主库宕机,故障转移期间,读请求都会平均分配到剩余存活的slave;

    新主库产生后,读请求平均分发给所有的主从;

    后面2个就不测了,知道它有效就行,先这样;

  • 相关阅读:
    暑假日报-11
    暑假日报-10
    暑假日报-9
    暑假日报-8
    暑假日报-7
    暑假日报-6
    暑假日报-5
    暑假日报-4
    暑假日报-3
    第二次集训的每日感想
  • 原文地址:https://www.cnblogs.com/gered/p/15210580.html
Copyright © 2020-2023  润新知