• 一致性哈希算法


    算法应用

    这是一种路由算法,适用于大部分的路由场景,优点是在伸缩性需求较高的场景中可以提高命中率。

    算法思路

    先构造一个长度为2的32次方的整数环(这个环被称为一致性Hash环),根据节点名称的Hash值(其分布为[-2^31, 231))将缓存服务器节点放置在这个Hash环上,然后根据需要缓存的数据的Key值计算得到其Hash值(其分布也为[-231, 2^31)),然后在Hash环上顺时针查找距离这个Key值的Hash值最近的服务器节点,完成Key到服务器的映射查找。

    实现方式(java、虚拟节点)

    • 使用TreeMap 作为一致性Hash环的数据结构,查找快。
    • 需要确定采用的Hash算法,确保计算得到的Hash值落在int整数区间内。
    • 一个物理节点对应虚拟节点数量为virtualNum。
    • 需要实现增加节点、删除节点、根据数据key得到服务器节点的方法。

    所以实现如下

    先定义一个Hash算法策略接口,将具体算法与业务代码解耦

    public interface HashStrategy {
        int hash(Object key);
    }
    

    增加一个实现类,这里采用MD5来实现,实际上具体实现方式最好由算法专家来确定

    public class MD5HashImpl implements HashStrategy{
    
        MessageDigest digest;
    
        public MD5HashImpl() throws NoSuchAlgorithmException {
            this.digest = MessageDigest.getInstance("MD5");
        }
    
        @Override
        public int hash(Object key) {
    
            if(key == null){
                return 0;
            }
    
            int h = key.hashCode();
    
            //开32位的空间
            byte[] bytes = new byte[4];
    
            //将h赋值给bytes数组
            for (int i=3;i>-1;i--){
                bytes[i] = (byte)(h>>(i*8));
            }
    
            byte[] hashBytes;
    
            synchronized (digest){
                hashBytes = digest.digest(bytes);
            }
    
            int result = 0;
            for(int i=0; i<4 ;i++){
                int idx = i*4;
                result += (hashBytes[idx + 3]&0xFF << 24)
                        | (hashBytes[idx + 2]&0xFF << 16)
                        | (hashBytes[idx + 1]&0xFF << 8)
                        | (hashBytes[idx + 0]&0xFF);
            }
            return result;
        }
    }
    

    定义服务器节点抽象类,这里定义一个简单版本

    public class Node {
        /**
         * 主机ip
         */
        private String ip;
    
        /**
         * 代表该主机中存放的KV
         */
        private ConcurrentHashMap map = new ConcurrentHashMap();
    
        public Node(String ip) {
            this.ip = ip;
        }
    
        public String getIp() {
            return ip;
        }
    
        public void setIp(String ip) {
            this.ip = ip;
        }
    
        public ConcurrentHashMap getMap() {
            return map;
        }
    }
    

    最后便是一致性hash算法的实现

    首先是直接在一致性hash环中增加物理节点的方式

    public class ConsistentHash {
    
        private final SortedMap<Integer,Node> circle = new TreeMap<>();
    
        private HashStrategy hashStrategy;
    
        public ConsistentHash(HashStrategy hashStrategy) {
            this.hashStrategy = hashStrategy;
        }
    
        public void addNode(Node node){
            circle.put(hashStrategy.hash(node.getIp()),node);
        }
    
        public void removeNode(Node node){
            circle.remove(hashStrategy.hash(node.getIp()));
        }
    
        /**
         * 根据key查找服务器节点
         * @param key
         * @return
         */
        public Node getNode(Object key){
            int hashCode = hashStrategy.hash(key);
    
            if(!circle.containsKey(hashCode)){
                //顺时针取得最近的节点
                SortedMap<Integer,Node> tailMap = circle.tailMap(hashCode);
                hashCode = tailMap.isEmpty()?circle.firstKey():tailMap.firstKey();
            }
    
            return circle.get(hashCode);
        }
    }
    

    如果要增加虚拟节点,只需要讲add和remove方法重写,如果追求代码优美,可以将物理节点与虚拟节点的映射方式定义一个接口。

    public class ConsistentHashWithVirtualNode {
        private final SortedMap<Integer, Node> circle = new TreeMap<>();
    
        private HashStrategy hashStrategy;
    
        private int virtualNum; // 把实际节点虚拟为多少个节点
    
        public ConsistentHashWithVirtualNode(HashStrategy hashStrategy, int virtualNum) {
            this.hashStrategy = hashStrategy;
            this.virtualNum = virtualNum;
        }
    
        public void addNode(Node node) {
            for (int i = 0; i < virtualNum; i++) {
                circle.put(hashStrategy.hash(i + node.getIp()), node);
            }
        }
    
        public void removeNode(Node node) {
            for (int i = 0; i < virtualNum; i++) {
                circle.remove(hashStrategy.hash(i + node.getIp()));
            }
        }
    
        /**
         * 根据key查找服务器节点
         *
         * @param key
         * @return
         */
        public Node getNode(Object key) {
            int hashCode = hashStrategy.hash(key);
    
            if (!circle.containsKey(hashCode)) {
                //顺时针取得最近的节点
                SortedMap<Integer, Node> tailMap = circle.tailMap(hashCode);
                hashCode = tailMap.isEmpty() ? circle.firstKey() : tailMap.firstKey();
            }
    
            return circle.get(hashCode);
        }
    }
    

    对于一个物理节点对应多少虚拟节点较好,貌似有一个经验值图标,在此不列出。

  • 相关阅读:
    题解-CF1375E Inversion SwapSort
    寒门再难出贵子
    js获取链接中的内容方法
    MySQL添加用户、删除用户、授权及撤销权限
    Ubuntu保存退出vim编辑器
    最全!Linux服务器下安装SVN,并添加SVN项目,自动更新项目文件到web目录
    php $_SERVER中的SERVER_NAME 和HTTP_HOST的区别以及REQUEST_URI的讲解
    RESTful API 最佳实践----转载阮一峰
    PHP图像处理(GD库)
    nginx.conf配置
  • 原文地址:https://www.cnblogs.com/Theshy/p/8601470.html
Copyright © 2020-2023  润新知