• HashMap源码浅析


    HashMap个人感觉是根据hash值分了类别的的链表或者红黑树。

    public class HashMap<K, V> extends AbstractMap<K, V> implements Map<K, V>, Cloneable, Serializable {
    
        private static final long serialVersionUID = 362498820763181265L;
        // 默认的HashMap的存储容量大小
        static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
        // 最大存储容量
        static final int MAXIMUM_CAPACITY = 1 << 30;
        // 默认的负载因子大小
        static final float DEFAULT_LOAD_FACTOR = 0.75f;
        // 每条链表长度到达8时开始转化为红黑树
        static final int TREEIFY_THRESHOLD = 8;
        // 每个红黑树存储结点个数为减少至6时解除红黑树,转化为链表
        static final int UNTREEIFY_THRESHOLD = 6;
        // 转化为红黑树的最小容量,table的长度超过64时,链表才会转化为红黑树
        static final int MIN_TREEIFY_CAPACITY = 64;
        // 存放结点的数组
        transient Node<K, V>[] table;
        // 用来保存缓存
        transient Set<Map.Entry<K, V>> entrySet;
        // 当前存储的键值对的个数
        transient int size;
        // 修改次数
        transient int modCount;
        // 使用的table容量size到达多少时进行扩容,一般为12
        int threshold;
        // 负载因子,当table使用到达负载因子大小时,进行table的扩容,DEFAULT_LOAD_FACTOR = 0.75f就说明,到达75%时扩容
        // 默认容量是16,那么使用容量到达12时进行扩容
        final float loadFactor;
    
        // 链表时期所使用的结点
        static class Node<K, V> implements Map.Entry<K, V> {
            final int hash;
            final K key;
            V value;
            Node<K, V> next;
    
            Node(int hash, K key, V value, Node<K, V> next) {
                this.hash = hash;
                this.key = key;
                this.value = value;
                this.next = next;
            }
    
            // hash值为key的hashcode与value的hashcode进行异或
            public final int hashCode() {
                return Objects.hashCode(key) ^ Objects.hashCode(value);
            }
    
            public final boolean equals(Object o) {
                if (o == this)
                    return true;
                if (o instanceof Map.Entry) {
                    Map.Entry<?, ?> e = (Map.Entry<?, ?>) o;
                    if (Objects.equals(key, e.getKey()) && Objects.equals(value, e.getValue()))
                        return true;
                }
                return false;
            }
        }
    
        // hash值为hashcode与hashcode右移16位进行异或
        static final int hash(Object key) {
            int h;
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
        }
    
        // 除了这个无参构造,还有3个有参构造
        // 其中两个有参构造是可以设置初始的hashmap默认大小和负载因子大小
        // 剩下的一个是可以直接将一个map作为参数复制到本hashmap中
        public HashMap() {
            this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
        }
    
        // 我们平时最常用的put操作
        public V put(K key, V value) {
            return putVal(hash(key), key, value, false, true);
        }
    
        // put操作调用该方法,onlyIfAbsent为false的话如果存在旧值会用新的值覆盖
        // evict的调用在void afterNodeInsertion(boolean evict){ }方法,可以看到这是一个空的方法
        final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
            // tab将指向存储结点的成员变量table
            Node<K, V>[] tab;
            // p将指向索引位置的那个结点
            Node<K, V> p;
            // n将为table的长度,不是table中所存储的键值对的个数,因为table有可能有一部分是null
            // i将为根据hash辅助计算出的索引位置
            int n, i;
            if ((tab = table) == null || (n = tab.length) == 0)
                // 如果table没有初始化,resize将重新设置table的大小
                n = (tab = resize()).length;
            // p指向根据hash值辅助计算所指向的那个结点
            // i为该索引位置,其计算方式为key的hash值和table的长度值减1进行与操作得出的值
            // 所以键值对只要key的hashcode向右移16位后的低几位的数字只要相同就会是同一个索引位置,放到同一个链表中,并不需要hashcode完全一致
            if ((p = tab[i = (n - 1) & hash]) == null)
                // p是null,说明那个索引位置就是空的,所以不需要去遍历链表或者红黑树来看是否已经存在这么一个结点
                // 如果是这样,那就会返回索引位置原来所存储的null
                tab[i] = newNode(hash, key, value, null);
            else {
                // p不是null,说明那个索引位置是有一条链表或者一个红黑树的,需要进行遍历检查要存储的键值对是否已经存在
                // e将指向查询出的那个结点
                Node<K, V> e;
                // 当前遍历的结点的key,也就是p的key
                K k;
                if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
                    // 如果p所存储的键值对和我们现在要存储的键值对相等,那运气很好,毕竟数组第一个结点就是
                    e = p;
                else if (p instanceof TreeNode)
                    // 如果p是一个树结点,那么应该使用遍历树的方式来遍历查询
                    e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);
                else {
                    // 否则说明当前是链表,那么应该使用遍历链表的方式来遍历查询
                    for (int binCount = 0;; ++binCount) {
                        if ((e = p.next) == null) {
                            // 进入if,说明已经遍历到了链表的末尾了,这里e为null
                            p.next = newNode(hash, key, value, null);
                            if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                                // 当前链表所存储的结点已经超过了8,需要转换为红黑树
                                treeifyBin(tab, hash);
                            break;
                        }
                        // 链表中的每个结点都需要进行比较
                        if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                            break;
                        p = e;
                    }
                }
                // 经过上面的遍历,e可能已经指向了旧的结点
                if (e != null) { // existing mapping for key
                    V oldValue = e.value;
    
                    if (!onlyIfAbsent || oldValue == null)
                        // 如果可以进行值覆盖
                        e.value = value;
                    // afterNodeAccess(e)是个空的方法
                    afterNodeAccess(e);
                    return oldValue;
                }
            }
            ++modCount;
            // 当前的table是否已经空间不足,需要重新设置大小
            if (++size > threshold)
                resize();
            // afterNodeInsertion(evict)是个空的方法
            afterNodeInsertion(evict);
            return null;
        }
    
        // 内部树结点类
        static final class TreeNode<K, V> extends LinkedHashMap.Entry<K, V> {
            TreeNode<K, V> parent; // red-black tree links
            TreeNode<K, V> left;
            TreeNode<K, V> right;
            TreeNode<K, V> prev; // needed to unlink next upon deletion
            boolean red;
    
            TreeNode(int hash, K key, V val, Node<K, V> next) {
                super(hash, key, val, next);
            }
    
            final TreeNode<K, V> putTreeVal(HashMap<K, V> map, Node<K, V>[] tab, int h, K k, V v) {
                // key的class
                Class<?> kc = null;
                // 是否查询,需要遍历一遍当前的红黑树,看是否已经存在这么一个键值对
                boolean searched = false;
                // root是树的根结点
                TreeNode<K, V> root = (parent != null) ? root() : this;
                // 这里是根据每个结点的存的key的hash值来作为结点间的比较
                for (TreeNode<K, V> p = root;;) {
                    // dir作为当前结点的key的hash值比这个要存入的键值对的hash值大还是小
                    // 以此来判断应该接下来是去遍历左孩子还是右孩子
                    // ph是当前结点的key的hash值
                    int dir, ph;
                    K pk;
                    if ((ph = p.hash) > h)
                        dir = -1;
                    else if (ph < h)
                        dir = 1;
                    else if ((pk = p.key) == k || (k != null && k.equals(pk)))
                        // 如果相等说明要存储的键值对已经在当前结点中
                        return p;
                    else if ((kc == null && (kc = comparableClassFor(k)) == null)
                            // 根据两个key的copare方法进行比较是否key相同
                            || (dir = compareComparables(kc, k, pk)) == 0) {
                        if (!searched) {
                            // 只有遍历的是根结点才根据hash值、key以及class遍历整个树进行查找
                            TreeNode<K, V> q, ch;
                            searched = true;
                            if (((ch = p.left) != null && (q = ch.find(h, k, kc)) != null)
                                    || ((ch = p.right) != null && (q = ch.find(h, k, kc)) != null))
                                return q;
                        }
                        // tieBreakOrder(k, pk)根据hashcode值比较k与pk的大小,返回-1或1
                        // 前面比较的相当于是损失了精度的hashcode,hash是hashcode与hashcode右移16位进行异或后的值,而tieBreakOrder(k,
                        // pk)是直接比较hashcode
                        dir = tieBreakOrder(k, pk);
                    }
                    // xp指向当前遍历的结点p,因为马上p就会指向它的孩子,有可能p会变为null
                    TreeNode<K, V> xp = p;
                    if ((p = (dir <= 0) ? p.left : p.right) == null) {
                        // p为null,说明整个红黑树没有找到当前要存储的这个键值对
                        Node<K, V> xpn = xp.next;
                        // newTreeNode方法为return new TreeNode<>(hash, key, value,
                        // next);
                        TreeNode<K, V> x = map.newTreeNode(h, k, v, xpn);
                        // 设定这个新结点为当前为左孩子还是右孩子
                        if (dir <= 0)
                            xp.left = x;
                        else
                            xp.right = x;
                        // 需要设置next、prev,因为有可能这个红黑树一会儿还会再转换为链表
                        xp.next = x;
                        x.parent = x.prev = xp;
                        if (xpn != null)
                            // xpn不为null,说明后面还有结点
                            ((TreeNode<K, V>) xpn).prev = x;
                        moveRootToFront(tab, balanceInsertion(root, x));
                        return null;
                    }
                }
            }
    
            // 确保树符合红黑树,现在最下层的结点,也就是叶子点有可能有问题,总的想法是用变色让发生问题的结点逐步趋向上层,用旋转达到平衡
            static <K, V> TreeNode<K, V> balanceInsertion(TreeNode<K, V> root, TreeNode<K, V> x) {
                // 新加入的结点永远初始状态为红色,因为如果是黑色,会直接违反每条路径上的黑色结点数目相同这一约定
                x.red = true;
                for (TreeNode<K, V> xp, xpp, xppl, xppr;;) {
                    if ((xp = x.parent) == null) {
                        x.red = false;
                        // 已经遍历到根节点
                        return x;
                    } else if (!xp.red || (xpp = xp.parent) == null)
                        // 父结点为黑色,那么就能直接加入,所以根节点还是原来的,直接返回
                        // 或者父节点为黑色,说明父结点为已经完成平衡的更新后的根结点
                        // 如果xpp为空,说明父结点为根结点,也直接返回
                        return root;
                    if (xp == (xppl = xpp.left)) {
                        // *到这里,父节点为红色且为祖结点的左孩子*
                        if ((xppr = xpp.right) != null && xppr.red) {
                            // 叔结点不为空且叔结点为红色
                            // 这种情况只进行变色,虽然可以右旋加变换一次新加入的结点的颜色达到同样的效果,但是那样步骤多,耗时
                            // 父和叔均变为黑色,现在父和叔以及新加入的结点没有问题了
                            // 有问题的结点从祖结点开始,祖结点变为红色
                            // 在这之后会有相应的左旋或右旋操作,最终完成时,根结点会更新,变为其它的结点
                            xppr.red = false;
                            xp.red = false;
                            xpp.red = true;
                            x = xpp;
                        } else {
                            // 叔结点为空或颜色为黑色,将有问题的结点向上推,只能选择旋转加变色
                            if (x == xp.right) {
                                // 这里左旋是为了之后的右旋
                                // 经过这一步操作,只关心颜色的话红色结点变为由右孩子变为左孩子
                                // rotateLeft第二个参数是围绕哪个结点进行左旋,这里是父节点,结点的顺序旋转后会有些变化
                                root = rotateLeft(root, x = xp);
                                xpp = (xp = x.parent) == null ? null : xp.parent;
                            }
                            // 经过上面的左旋后,原本的父节点变为x,旧的x变为父节点,但是祖结点还是原来的祖结点
                            // 这里围绕祖结点进行右旋,祖结点变色
                            if (xp != null) {
                                xp.red = false;
                                if (xpp != null) {
                                    xpp.red = true;
                                    root = rotateRight(root, xpp);
                                }
                            }
                            // 经过上面的左旋和右旋加变色,新加入的结点或者父节点二者之一成为了祖结点,原本的祖结点变为了现在祖结点的右孩子(红色)
                            // 而叔结点变为原本的祖结点的右孩子,符合红色结点的孩子结点为黑色,此时二叉树平衡
                            // 只有旋转才能平衡,如果进入了这个else,经过上面的步骤就完成了平衡
                        }
                    } else {
                        // 同上
                        if (xppl != null && xppl.red) {
                            xppl.red = false;
                            xp.red = false;
                            xpp.red = true;
                            x = xpp;
                        } else {
                            if (x == xp.left) {
                                root = rotateRight(root, x = xp);
                                xpp = (xp = x.parent) == null ? null : xp.parent;
                            }
                            if (xp != null) {
                                xp.red = false;
                                if (xpp != null) {
                                    xpp.red = true;
                                    root = rotateLeft(root, xpp);
                                }
                            }
                        }
                    }
                }
            }
    
            // 将根节点设置到table索引位置,就是链表的头结点
            static <K, V> void moveRootToFront(Node<K, V>[] tab, TreeNode<K, V> root) {
                int n;
                if (root != null && tab != null && (n = tab.length) > 0) {
                    int index = (n - 1) & root.hash;
                    TreeNode<K, V> first = (TreeNode<K, V>) tab[index];
                    if (root != first) {
                        Node<K, V> rn;
                        tab[index] = root;
                        TreeNode<K, V> rp = root.prev;
                        if ((rn = root.next) != null)
                            ((TreeNode<K, V>) rn).prev = rp;
                        if (rp != null)
                            rp.next = rn;
                        if (first != null)
                            first.prev = root;
                        root.next = first;
                        root.prev = null;
                    }
                    assert checkInvariants(root);
                }
                // 总的来说,就是把原本的第一个结点first设置到root后面,也就是说first成为第二个结点
                // root结点的前后结点互相设置为相邻结点,root结点设置为头结点
            }
    
            // 前面的方法看过了,这里就很清楚的知道是要找到根结点和新插入的结点,做一次平衡插入,将新的根结点设置到table的相应索引位置
            final void treeify(Node<K, V>[] tab) {
                TreeNode<K, V> root = null;
                for (TreeNode<K, V> x = this, next; x != null; x = next) {
                    next = (TreeNode<K, V>) x.next;
                    x.left = x.right = null;
                    if (root == null) {
                        x.parent = null;
                        x.red = false;
                        root = x;
                    } else {
                        K k = x.key;
                        int h = x.hash;
                        Class<?> kc = null;
                        for (TreeNode<K, V> p = root;;) {
                            int dir, ph;
                            K pk = p.key;
                            if ((ph = p.hash) > h)
                                dir = -1;
                            else if (ph < h)
                                dir = 1;
                            else if ((kc == null && (kc = comparableClassFor(k)) == null)
                                    || (dir = compareComparables(kc, k, pk)) == 0)
                                dir = tieBreakOrder(k, pk);
    
                            TreeNode<K, V> xp = p;
                            if ((p = (dir <= 0) ? p.left : p.right) == null) {
                                x.parent = xp;
                                if (dir <= 0)
                                    xp.left = x;
                                else
                                    xp.right = x;
                                root = balanceInsertion(root, x);
                                break;
                            }
                        }
                    }
                }
                moveRootToFront(tab, root);
            }
            
            //从根结点开始遍历
            final TreeNode<K,V> getTreeNode(int h, Object k) {
                return ((parent != null) ? root() : this).find(h, k, null);
            }
            //kc为key的class
            final TreeNode<K,V> find(int h, Object k, Class<?> kc) {
                //这里的this通常为根结点或者根结点的左右孩子
                TreeNode<K,V> p = this;
                do {
                    int ph, dir; K pk;
                    TreeNode<K,V> pl = p.left, pr = p.right, q;
                    if ((ph = p.hash) > h)
                        p = pl;
                    else if (ph < h)
                        p = pr;
                    else if ((pk = p.key) == k || (k != null && k.equals(pk)))
                        return p;
                    else if (pl == null)
                        p = pr;
                    else if (pr == null)
                        p = pl;
                    else if ((kc != null ||
                              (kc = comparableClassFor(k)) != null) &&
                            //调用key的compare方法,比较两个key是否相等
                             (dir = compareComparables(kc, k, pk)) != 0)
                        p = (dir < 0) ? pl : pr;
                    else if ((q = pr.find(h, k, kc)) != null)
                        return q;
                    else
                        p = pl;
                } while (p != null);
                return null;
                //总之中序遍历整个树,找到了就返回,找不到返回空
            }
    
        }
    
        // 链表转树
        final void treeifyBin(Node<K, V>[] tab, int hash) {
            int n, index;
            Node<K, V> e;
            if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
                // 如果当前talbe的长度没有超过64个,扩容
                resize();
            else if ((e = tab[index = (n - 1) & hash]) != null) {
                // 如果当前talbe的长度超过64个,链表转化为红黑树
                // 每个链表中的每个结点都生成一个对应的树结点
                TreeNode<K, V> hd = null, tl = null;
                do {
                    // replacementTreeNode(e, null)方法返回为return new
                    // TreeNode<>(p.hash, p.key, p.value, next);
                    TreeNode<K, V> p = replacementTreeNode(e, null);
                    if (tl == null)
                        hd = p;
                    else {
                        p.prev = tl;
                        tl.next = p;
                    }
                    tl = p;
                } while ((e = e.next) != null);
                // 前面已经对每一个链表中的结点都相应的生成了一个树结点,hd代表头结点,也是树暂时的根结点,此时这些树结点和table还没有关系
                if ((tab[index] = hd) != null)
                    // 调用这个方法是为了对红黑树进行一次排序,并将真正的符合要求的根结点设置到table
                    hd.treeify(tab);
            }
        }
        //我们平时常用的get方法
        public V get(Object key) {
            Node<K,V> e;
            return (e = getNode(hash(key), key)) == null ? null : e.value;
        }
        //根据hash值和key获取一个结点
        final Node<K,V> getNode(int hash, Object key) {
            Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
            if ((tab = table) != null && (n = tab.length) > 0 &&
                (first = tab[(n - 1) & hash]) != null) {
                if (first.hash == hash && // always check first node
                    ((k = first.key) == key || (key != null && key.equals(k))))
                    //第一个结点的key相同就返回第一个结点
                    return first;
                if ((e = first.next) != null) {
                    //第一个结点不是,从第二个结点开始遍历
                    if (first instanceof TreeNode)
                        //现在是一个树,那么用遍历树的方式去查询是否有这么一个结点
                        return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                    
                    do {
                        //否则是一个链表,遍历链表查看是否有这么一个结点
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            return e;
                    } while ((e = e.next) != null);
                }
            }
            //没有找到符合的结点
            return null;
        }
        
    }

    上面的各个内部类的代码仅凭个人主观放了一部分,没有放全,其余的remove、isEmpty等方法有兴趣的同学可以自己看看。

    2019.10.22

    jdk1.7ConcurrentHashMap  就是一个数组里装了HashMap,每个HashMap增删改直接锁住,因为每个结点的next为final,所以只能在HashMap,每个链表头插入新结点。

      jdk1.7分析:https://www.cnblogs.com/shan1393/p/9020564.html

    jdk1.8ConcurrentHashMap  put操作,如果通过hash找到的那个索引位置是空的,那么通过cas来保证多线程下的安全,如果不是空的,锁住头节点,保证多线程下安全

      jdk1.8分析:https://www.cnblogs.com/junjiang3/p/8686290.html

  • 相关阅读:
    mysql的查询、子查询及连接查询
    面向对象知识点续及单例模式
    PSR-2 编码风格规范
    PSR-1 基础编码规范
    博客园文章添加版权信息的方法
    微博第三方登陆接入流程
    使用EasyWechat快速开发微信公众号支付
    Git版本管理工具的使用
    E: Could not get lock /var/lib/apt/lists/lock
    ubuntu安装opencv
  • 原文地址:https://www.cnblogs.com/darkclouds/p/11625902.html
Copyright © 2020-2023  润新知