基于redis的分布式缓存disgear开源到github上了

基于redis的分布式缓存disgear开源到github上了

disgear是笔者参考solrcloud架构基于redis实现的分布式的缓存，支持数据切分到多台机器上，支持HA，支持读写分离和主节点失效自动选举，目前把它开放到github上，开放给大家

github:https://github.com/yangbutao/disgear

总体设计







1. 系统需求

1) 性能

内存操作，读写性能要求比较高

2) 数据量

支持数据切分，分为多个Shard，每个shard负责一定范围的数据

3) 伸缩性

当单个节点的数据量比较大的时，可以对该节点进行数据切分，分离成两部分，增加新的机器即可。

4) 可用性

系统不存在单点问题，缓存节点支持HA，master节点宕掉后，自动选举一个slave为主节点，对客户端透明

2. 设计说明

首先启动好所有的redis实例，每个redis实例有一个agent负责监控，agent ping redis实例的状态，agent 连接到zookeeper上创建/collections/collection1/leader_elect/shard1/election下的节点，监控比它小的节点，变化时更新leader节点。

当agent连接zookeeper超时或者agent ping redis实例超时，会删除zookeeper上的election下的节点(agent ping redis超时，调用zookeeper api删除节点)。

当ping到redis节点起来后，若检查到zookeeper上没有对应节点，则创建相应节点。

Leader(master)是缓存负责响应的节点，replica(slave)只负责同步leader的数据，当leader宕机后，提升replica为主节点。

以下是zookeeper上节点的相关说明：

/collections

   |----collection1

        |----leader_elect

               ----shard1[0-7ffffffff]      //节点启动时，一共需要分几个分区，需要声明该节点属于哪个shard

                   ---election         //参与选举的节点列表，竞争成为leader节   点，并更新leaders节点列表和clusterstate.json节点内容，并调用脚本更改redis的master slave配置

                        ----10.1.1.21

                        ----10.1.1.22

               ----shard2

                   ---eclection

                        ---10.1.1.23

                        ---10.1.1.24

         |---leaders

              ----shard1              //当前shard的leader节点

                  ---10.1.1.21

              -----shard2

                  ----10.1.1.24

/observer                //负责watch collections中节点的变化，

由leader节点更新 clusterstate.json节点的内容，observer节点需要在系统初始化过程中最新选举出leader节点，做watch collections下的节点的变化。

     |---election          //其下是供选择的节点

     |----leader           //这样一个好处是每个client节点无需对多个zookeeper的节点监控计算，由单独的节点对这些变化的节点做监控，来更新集群状态，这样每个client只需要 watch 集群状态内容zookeeper节点即可。

/live_nodes

    |---10.1.1.21

    |----10.1.1.22

    |----10.1.1.23

    |-----10.1.1.24

/clusterstate.json                      //集群状态，当有节点变化时，更新这个节点内容，每个client端监听该节点内容的变化, 缓存在本地cache中。

相关内容如下：

{collection1={

  "shards":{

    "shard1":{

      "range":"80000000-ffffffff",

       “leader”:node1,

      "replicas":{

        "node1":{

          "state":"alive",         "node_name":"192.168.1.21:8983"},

        "node2":{

          "state":"alive",

            "node_name":"192.168.1.22:8983"

          }}},

"shard2":{

      "range":"0-7fffffff",

      "state":"active",

       “leader”:node3,

      "replicas":{

        "node3":{

         "node_name":"192.168.1.23:8983"},

        "core_node4":{

           "node_name":"192.168.1.24:8983"

          }}},

模块设计说明

1. 数据切分、节点扩容、key hash

对于数据切分，数据的范围取Integer.MIN_VALUE, Integer.MAX_VALUE，首次初始化时，根据规划的Shard的数量，平均进行切分，每个Shard负责一个固定的数据范围，比如Shard1[0-7fffffff]，这些Shard和数据的范围会持久化到zookeeper节点上，以便于集群重启后，从zookeeper本地拉起Shard划分和数据范围的相关数据，如下图所示。

/collections

   |----collection1

        |----leader_elect

               ----shard1[0-7ffffffff]

               ----shard2[800000-9ffffffff]

当需要扩容缓存节点时，管理员可以对Shard进行split操作，生成两个新的Shard，每个Shard负责一部分数据，注册在zooleeper上的/collections/collection1/leader_elect节点下。比如Shard1[0-7ffffffff]经过split操作后，变成Shard1_1[0-3ffffffff]和Shard1_2[400000-7fffffffff]。

/collections

   |----collection1

        |----leader_elect

               ----shard1[0-7ffffffff]

               ----shard2[800000-9ffffffff]

                   ----shard1_1[0-3ffffffff]

                   ----shard1_2[0-3ffffffff]

新的节点加入到新的Shard分区中，完成leader选举等一系列操作后，更新集群拓扑状态，并删除老的Shard分区，这样新的Shard就处于可用状态。

对于key的hash定位，采用murmurhash3_x86_32 算法，效率比较高，然后判断该hash值落在哪个shard的数据范围内，进行数据的分区定位。

2. 缓存代理Agent

Agent作为缓存节点的代理，一方面和zookeeper进行通信，把缓存节点的状态通知给zookeeper，另外一方面对redis缓存节点做管理和监控。

1) Agent检测redis节点是否存活：

需要在Agent中调用以下脚本(monitor_redis.sh)，把返回的结果，通知给zookeeper

ALIVE=$(/opt/cache/redis-2.6.16/src/redis-cli -h 10.1.1.25 -p 6379 -a 123 PING)

echo $ALIVE

2) 变更为master节点

当节点上的agent在zookeeper上成为leader节点时，需要通知agent把它代理的redis变更为master节点，agent调用以下脚本。

主节点的脚本(redis_master.sh)：

#!/bin/bash

/opt/cache/redis-2.6.16/src/redis-cli -h 10.1.1.26 -p 6379 slaveof NO ONE

3) 变更为slave节点

当节点上的agent在zookeeper上成为replica节点时，需要通知agent把它代理的redis变更为slave节点，agent调用以下脚本。

slave节点脚本(redis_slaves.sh)：

#!/bin/bash

/opt/cache/redis-2.6.16/src/redis-cli -h 10.1.1.26 -p 6379 slaveof 10.1.1.25 6379

3. 集群状态观察者Observer

Observer负责对整个集群collection下的Shard节点的变动进行监听，更新zookeeper上的集群状态节点cloudstate.json。

Agent节点在启动过程中，首选要做的就是Observer的选举。

Observer需要由zookeeper选举出来后，监听collections下节点的变化，若有变化则进行处理process，计算的结果设置到zookeeper的cloudstate.json节点。

当cloudstate.json节点数据变化时，负责监听该节点的所有客户端都更新本地客户端内存。

/observer

     |---election

          ----10.1.1.21

          ----10.1.1.22

         -----10.1.1.23

     |----leader

           -----10.1.1.22

4. Shard leader选举

Shard节点在zookeeper上创建完成后，缓存节点在启动的过程中，需要通过命令行-D参数或者配置文件的形式加入到集群中的某一个Shard分区下，参与leader的选举，具体实现是为每个节点生成一个数字，每个节点只需要监控比自己小的节点即可，如有变化，则进行通知，并使得数字最小的节点成为leader节点。

/collections

   |----collection1

        |----leader_elect

               ----shard1               //节点启动时，一共需要分几个分区，需要声明该节点属于哪个shard

                   ---eclection         //参与选举的节点列表，竞争成为leader节   点，并更新leaders节点列表和clusterstate.json节点内容，并调用脚本更改redis的master slave配置

                        ----10.1.1.21

                        ----10.1.1.22

               ----shard2

                   ---eclection

                        ---10.1.1.23

                        ---10.1.1.24

         |---leaders

              ----shard1              //当前shard的leader节点

                  ---10.1.1.21

              -----shard2

                  ----10.1.1.24

5. 缓存节点的扩容

当某shard的访问压力过大或者数据量比较大时候，节点的扩展有两种方式，

一种是增加shard中的节点数量，提高读的能力，这种方式已经实现；

另外一种方式对压力大的shard做split的操作，一个shard分割为两个shard，提高shard的写数据的能力，这种节点的扩展方式目前还不支持，已纳入到后续的计划中。

使用说明

Agent的启动脚本：

MAIN="com.newcosoft.cache.agent.AgentMain"
$JAVA $JAVA_OPTS -cp "$CLASSPATH" $JVMFLAGS $MAIN -Dcol=col1 -Dshard=shard1 -Dnode=node25
-DbaseUrl=10.1.1.25:6379 -DscriptPath=/opt/lsmp -DshardNum=3 -Dzk_url=10.1.1.25:2181

其中-Dcol表示当前创建的collection名称，对于redis来讲，代表要存储库的逻辑名称

-Dshard表示当前的节点的shard名称

-Dnode表示当前节点的逻辑名称

-DbaseUrl表示redis的主机IP和端口号

-DscriptPath表示redis监控和操作相关的脚本的路径，脚本有monitor_redis.sh、redis_master.sh、redis_slaves.sh

-DshardNum表示当前collection中的shard数目

-Dzk_url代表zookeeper集群的地址

Client端的使用：

在使用disgear的client端启动初始化中，引用disgear相关的jar，并调用

com.newcosoft.client.ClusterStateCacheManager.INSTANCE=new ClusterStateCacheManager(zkUrl);

ClusterStateCacheManager.INSTANCE.createClusterStateWatcher();

创建clusterState的监听器。

这样后续通过com.newcosoft.client.ClusterStateCacheManager.INSTANCE.getClusterState()就可以获得当前集群的节点状态，

进而选择合适的节点进行分发数据存取请求。
相关阅读:
适配器模式
 自己DIY word2010脚注和尾注没有的格式
 Linux单网卡，双IP，双网关配置，并搭建squid proxy上网
 about using gnuplot
ReadDirectoryChangesW 函数流沙
 Jquery easyui 异步树流沙
 Overlapped I/O 学习流沙
 jQuery.get(url,[data],[callback]) 流沙
 MsgWaitForMultipleObjectsEx用法流沙
 Oracle smon_scn_time 表说明
原文地址：https://www.cnblogs.com/archoncap/p/4882803.html

基于redis的分布式缓存disgear开源到github上了

总体设计

1. 系统需求

1) 性能

2) 数据量

3) 伸缩性

4) 可用性

2. 设计说明

模块设计说明

1. 数据切分、节点扩容、key hash

2. 缓存代理Agent

1) Agent检测redis节点是否存活：

2) 变更为master节点

3) 变更为slave节点

3. 集群状态观察者Observer

4. Shard leader选举

5. 缓存节点的扩容

使用说明