• Java中的容器(集合)之HashMap源码解析


    1、HashMap源码解析(JDK8

    基础原理:

    • 对比上一篇《Java中的容器(集合)之ArrayList源码解析》而言,本篇只解析HashMap常用的核心方法的源码。
    • HashMap是一个以键值对存储的容器。
    • hashMap底层实现为数组+链表+红黑树(链表超过8时转为红黑树,JDK7为数组+链表)。
    • HashMap会根据key的hashCode得到对应的hash值,再去数组中找寻对应的数组位置(下标)。
    • hash方法如下:
    static final int hash(Object key) {
            int h;
            //hashCode()返回散列值,这是Object中的一个方法
            // ^ 按位异或,& 按位与,|按位或;&&逻辑与,||逻辑或
            // >>> 无符号右移
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
            }

    HashMap的一些属性

    • 关于其中加载因子属性(DEFAULT_LOAD_FACTOR ,loadFactor),主要是针对元素量而言,越大元素放的越多,空间利用率高,不过容易碰撞,查找时间多;越小元素放的越少,不容易碰撞,不过浪费空间,查找时间少。
    • 关于threshold属性,它是HashMap的扩容标准,计算规则为容量*加载因子,比如默认情况为16*0.75=12,达到这个值的时候就会进行扩容(扩容操作比较耗费性能)。
    • 源码及释义如下:
    public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable {
        // 序列号
        private static final long serialVersionUID = 362498820763181265L;
        // 默认的初始容量,需为2的幂次方(为了减少哈希碰撞),<< 表示左移,运算规则为乘以2的n次方,1<<4=16
        static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
        // 最大容量,如果由某个带参构造函数隐式的指定了更高的值,需为2的幂次方且小于1 << 30
        static final int MAXIMUM_CAPACITY = 1 << 30;
        // 构造函数中未指定时使用的加载因子,即默认加载因子
        static final float DEFAULT_LOAD_FACTOR = 0.75f;
        // 当传入的节点大于2且至少为8的时候,链表节点转为红黑树
        static final int TREEIFY_THRESHOLD = 8;
        // 当节点小于为6的时候,红黑树退化为链表
        static final int UNTREEIFY_THRESHOLD = 6;
        // 红黑树中对应的最小表容量应该最少为4*TREEIFY_THRESHOLD,以避免在调整大小和红黑树阈值之间的冲突。
        static final int MIN_TREEIFY_CAPACITY = 64;
        // 在第一次使用的时候初始化表,且根据需要设置大小,分配的大小总是2的幂次方
        transient Node<k,v>[] table;
        // 保存元素的集,需要注意的是,它使用的AbstractMap字段是keySet()和values()。
        transient Set<map.entry<k,v>> entrySet;
        // 此映射中包含的键值映射数,键值是一个整体,不等于数组的长度(因为存在哈希碰撞之后的链表和红黑树)
        transient int size;
        // 每次扩容和更改map结构的计数器
        transient int modCount;
        // 下一个要调整大小的大小值(容量*加载因子)
        int threshold;
        // hash表的加载因子
        final float loadFactor;
    }

    静态内部类Node:

    • 源码及释义如下:
    //静态内部类,实现了Map.Entry<K,V>接口
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;//哈希值,用于与其他元素的哈希值进行比较
        final K key;//
        V value;//
        Node<K,V> next;//下一个节点
    
        //构造器
        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }
    
        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }  
    
        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }
    
        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }
    
        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                        Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

    JDK8增加了树节点静态内部类用于红黑树

    • 部分源码及释义如下:
    static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
        TreeNode<K, V> parent;  // red-black tree links
        TreeNode<K, V> left;
        TreeNode<K, V> right;
        TreeNode<K, V> prev;    // needed to unlink next upon deletion
        boolean red; //判断是否为红
    
        TreeNode(int hash, K key, V val, Node<K, V> next) {
            super(hash, key, val, next);
        }
    
        /**
         * 返回包含此节点的树的根节点
         */
        final TreeNode<K, V> root() {
            for (TreeNode<K, V> r = this, p; ; ) {
                if ((p = r.parent) == null)
                    return r;
                r = p;
            }
        }
    }

    HashMap的构造器

    • 主要有四个,源码及释义如下:
        /**
         * 指定容量以及加载因子构造一个空的HashMap
         */
        public HashMap(int initialCapacity, float loadFactor) {
            if (initialCapacity < 0)
                throw new IllegalArgumentException("Illegal initial capacity: " +
                        initialCapacity);
            if (initialCapacity > MAXIMUM_CAPACITY)
                initialCapacity = MAXIMUM_CAPACITY;
            if (loadFactor <= 0 || Float.isNaN(loadFactor))
                throw new IllegalArgumentException("Illegal load factor: " +
                        loadFactor);
            this.loadFactor = loadFactor;
            this.threshold = tableSizeFor(initialCapacity);
        }
    
        /**
         * 指定容量以及默认加载因子0.75构造一个空的HashMap
         */
        public HashMap(int initialCapacity) {
            this(initialCapacity, DEFAULT_LOAD_FACTOR);
        }
    
        /**
         * 以默认容量16以及默认加载因子0.75构造一个空的HashMap
         */
        public HashMap() {
            this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
        }
    
        /**
         * 以另一个Map的键值对构造一个新的HashMap。新HashMap的容量最少足够存储旧HashMap的键值对数,加载因子为默认加载因子0.75
         */
        public HashMap(Map<? extends K, ? extends V> m) {
            this.loadFactor = DEFAULT_LOAD_FACTOR;
            putMapEntries(m, false);
        }
    • 其中第四个构造函数有用到putMapEntries()这个方法,其源码如下:
        /**
         * 实现map.putall和map构造函数
         */
        final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
            int s = m.size();
            //判断m是否为空
            if (s > 0) {
                //判断table是否初始化
                if (table == null) { // pre-size
                    //计算m的总容量,计算规则为使用容量/加载因子+1
                    float ft = ((float)s / loadFactor) + 1.0F;
                    //将m总容量与HashMap规定的最大容量相比得到最终容量
                    int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                            (int)ft : MAXIMUM_CAPACITY);
                    //判断最终容量是否大于扩容阈值(扩容阈值计算规则:容量*加载因子)
                    if (t > threshold)
                        threshold = tableSizeFor(t);
                }
                //如果m的键值对数大于扩容阈值,则进行扩容
                else if (s > threshold)
                    resize();
                //将m中的键值对添加到新HashMap中
                for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
                    K key = e.getKey();
                    V value = e.getValue();
                    putVal(hash(key), key, value, false, evict);
                }
            }
        }
    • 针对putMapEntries()方法中的扩容操作,可以查看resize()方法,源码及释义如下:
        /**
         * 初始化表或者将表容量翻倍,如果为空则分配初始容量,否则以2的幂次方扩容,需要保持索引一致
         * @return
         */
        final Node<K,V>[] resize() {
            //得到表
            Node<K,V>[] oldTab = table;
            //判断表是否初始化
            int oldCap = (oldTab == null) ? 0 : oldTab.length;
            int oldThr = threshold;
            int newCap, newThr = 0;
            if (oldCap > 0) {
                //如果旧容量大于最大值,则不扩容
                if (oldCap >= MAXIMUM_CAPACITY) {
                    threshold = Integer.MAX_VALUE;
                    return oldTab;
                }
                //判断旧容量的两倍容量(左移表示乘以2的n次方)是否小于最大容量,且旧容量是否大于等于默认容量
                else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                        oldCap >= DEFAULT_INITIAL_CAPACITY)
                    //扩容两倍
                    newThr = oldThr << 1; // double threshold
            }
            //否则如果旧阈值大于0,则初始化容量设置为旧阈值
            else if (oldThr > 0) // initial capacity was placed in threshold
                newCap = oldThr;
            else {               // zero initial threshold signifies using defaults
                //否则新容量设置为默认容量(因为旧容量小于0)
                newCap = DEFAULT_INITIAL_CAPACITY;
                //新阈值设置为默认容量乘以默认加载因子,即16*0.75
                newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
            }
            //如果新阈值为0,则重新计算新阈值
            if (newThr == 0) {
                float ft = (float)newCap * loadFactor;
                newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                        (int)ft : Integer.MAX_VALUE);
            }
            threshold = newThr;
            @SuppressWarnings({"rawtypes","unchecked"})
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];  //此方法返回的新table
            //如果旧table为空,则初始化
            table = newTab;
            //否则将旧table的值放入新table
            if (oldTab != null) {
                //旧table的值循环放入新table
                for (int j = 0; j < oldCap; ++j) {
                    Node<K,V> e;
                    //判断当前节点是否有值
                    if ((e = oldTab[j]) != null) {
                        //旧table节点置为空
                        oldTab[j] = null;
                        //如果该节点没有子节点,则返回新table,元素放入的位置为e的哈希值按位与(新容量-1)
                        if (e.next == null)
                            newTab[e.hash & (newCap - 1)] = e;
                        //否则如果该节点属于红黑树节点,将其切割赋给新红黑树
                        else if (e instanceof TreeNode)
                            ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                        //保持索引一致
                        else { // preserve order
                            Node<K,V> loHead = null, loTail = null;
                            Node<K,V> hiHead = null, hiTail = null;
                            Node<K,V> next;
                            do {
                                next = e.next;
                                //旧索引
                                if ((e.hash & oldCap) == 0) {
                                    if (loTail == null)
                                        loHead = e;
                                    else
                                        loTail.next = e;
                                    loTail = e;
                                }
                                //新索引
                                else {
                                    if (hiTail == null)
                                        hiHead = e;
                                    else
                                        hiTail.next = e;
                                    hiTail = e;
                                }
                            } while ((e = next) != null);
                            //旧索引放入table
                            if (loTail != null) {
                                loTail.next = null;
                                newTab[j] = loHead;
                            }
                            //新索引放入table
                            if (hiTail != null) {
                                hiTail.next = null;
                                newTab[j + oldCap] = hiHead;
                            }
                        }
                    }
                }
            }
            return newTab;
        }
        //put元素到map中
        public V put(K key, V value) {
            //实际调用的是putVal()方法
            return putVal(hash(key), key, value, false, true);
        }
    
        //putVal()方法用于实际操作插入元素
        final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                       boolean evict) {
            Node<K,V>[] tab; Node<K,V> p; int n, i;
            //table未初始化,调用resize()进行扩容(使用的都是默认值)
            if ((tab = table) == null || (n = tab.length) == 0)
                n = (tab = resize()).length;
            //判断(n - 1) & hash]索引处的table是否为空,为空,则插入新节点(table为空,此时插入的节点是在数组中)
            if ((p = tab[i = (n - 1) & hash]) == null)
                tab[i] = newNode(hash, key, value, null);
            //table不为空
            else {
                Node<K,V> e; K k;
                //判断节点的hash以及key是否相等,是则覆盖。
                if (p.hash == hash &&
                        ((k = p.key) == key || (key != null && key.equals(k))))
                    e = p;
                //否则如果属于树节点,使用putTreeVal插入节点数据(putTreeVal是针对红黑树的putVal方法),有兴趣的可以看一下putTreeVal方法
                else if (p instanceof TreeNode)
                    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                else {
                    //是一个链表
                    for (int binCount = 0; ; ++binCount) {
                        //判断是否到达链表末尾
                        if ((e = p.next) == null) {
                            //在链表末尾插入数据
                            p.next = newNode(hash, key, value, null);
                            //如果大于规则节点数(8),则转为红黑树存储
                            if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                                treeifyBin(tab, hash);
                            //跳出循环
                            break;
                        }
                        //判断插入元素与链表中原有元素的hash以及key是否相等
                        if (e.hash == hash &&
                                ((k = e.key) == key || (key != null && key.equals(k))))
                            //相等,跳出循环
                            break;
                        //循环链表
                        p = e;
                    }
                }
                //存在键值对的key
                if (e != null) { // existing mapping for key
                    //存储旧值
                    V oldValue = e.value;
                    if (!onlyIfAbsent || oldValue == null)
                        //替换为新值
                        e.value = value;
                    //访问后回调
                    afterNodeAccess(e);
                    //返回旧值
                    return oldValue;
                }
            }
            ++modCount;
            //插入的时候,判断容量是否大于阈值
            if (++size > threshold)
                //是,则进行扩容
                resize();
            //插入后回调
            afterNodeInsertion(evict);
            return null;
        }
    • 关于get的源码及释义如下:
        //通过指定key从map中get值
        public V get(Object key) {
            Node<K,V> e;
            //实际调用的是getNode()方法
            return (e = getNode(hash(key), key)) == null ? null : e.value;
        }
    
        //getNode()方法用于实际操作查询元素值
        final Node<K,V> getNode(int hash, Object key) {
            Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
            //判断存在table是否初始化
            if ((tab = table) != null && (n = tab.length) > 0 &&
                    (first = tab[(n - 1) & hash]) != null) {
                //总是检查第一个节点,如果第一个节点与需要查询的节点的hash以及key相等,则返回第一个节点
                if (first.hash == hash && // always check first node
                        ((k = first.key) == key || (key != null && key.equals(k))))
                    return first;
                //如果存在多个节点
                if ((e = first.next) != null) {
                    //如果属于红黑树,则调用红黑树中的getTreeNode方法查询,有兴趣的可以看一下getTreeNode方法
                    if (first instanceof TreeNode)
                        return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                    //否则在链表中查询
                    do {
                        //如果链表节点与需要查询的节点的hash以及key相等,则返回链表节点
                        if (e.hash == hash &&
                                ((k = e.key) == key || (key != null && key.equals(k))))
                            return e;
                    } while ((e = e.next) != null);
                }
            }
            return null;
        }

     (以上所有内容皆为个人笔记,如有错误之处还望指正。)

  • 相关阅读:
    [dj]Django外键(ForeignKey)操作以及related_name的作用
    [java]快速创建servlet和springmvc测试项目
    [sql]mybatis中动态sql
    [sql]mysql中使用 where 1=1和 0=1 的作用及好处
    [sql]sql中分组查询/union/join
    JavaScripts学习日记——DOM SAX JAXP DEMO4J XPath
    JavaScripts学习日记——XML DTD Schema
    JavaScripts学习日记——DOM
    JavaScripts学习日记——BOM
    JavaScripts学习日记——ECMAscript
  • 原文地址:https://www.cnblogs.com/xihuantingfeng/p/11619628.html
Copyright © 2020-2023  润新知