• JDK1.8 重识HashMap


    摘要

    JDK1.8相较于1.7对HashMap做了很大的优化,比如加入了新数据结构红黑树、Hash算法的优化和扩容的优化。

    本篇结合这些区别,探索HashMap的结构实现和功能原理。

    存储结构-字段

    从数据结构来看,HashMap是数组+链表+红黑树实现的,如图所示:

    HashMap中重要的几个属性(JDK 1.8):

    1 static final int MAXIMUM_CAPACITY = 1 << 30;        // 所能容纳的Node极限数量
    2 static final float DEFAULT_LOAD_FACTOR = 0.75f;     // 负载因子
    3 static final int TREEIFY_THRESHOLD = 8;             // 当链表长度超过8时,将链表结构转为红黑树结构
    4 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // Node[] table的初始化长度length(默认值是16)

    功能实现-方法

    1.确定哈希桶数组索引位置

    不管是增加、删除、查找键值对,定位到哈希桶数组的位置都是很关键的第一步。HashMap的数据结构是基于数组和链表(和红黑树),所以元素分布的越均匀,尽量使得每个位置上都只有一个元素(没有链表),那么我们用hash算法获取元素的时候,马上就可以得到,不需要遍历链表。HashMap定位索引位置,直接决定了hash方法的离散性能。下面看它是怎么做的:

    static final int hash(Object key) {
            int h;
            // 第一步:h = key.hashCode() 取key的hashCode值
            // 第二步:h ^ (h >>> 16)      高位参与运算
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
        }
        对于任意给定的对象,key的hashCode()返回值是一定的不变的。
        为什么用这个算法?
            key.hashCode()函数调用的是key键值类型自带的哈希函数,返回int型散列值。

    Java中'&'与、'|'或、'^'异或、'<<'左移位、'>>'右移位

    2.分析HashMap的put方法

     1 public V put(K key, V value) {
     2     return putVal(hash(key), key, value, false, true);
     3 }
     4 static final int hash(Object key) {
     5     int h;
     6     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
     7 }
     8 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
     9                boolean evict) {
    10     Node<K,V>[] tab; Node<K,V> p; int n, i;
    11     // 判断数组table是否为空或为null,否则执行resize()进行扩容
    12     if ((tab = table) == null || (n = tab.length) == 0)
    13         n = (tab = resize()).length;
    14     // 根据Key计算的hash值得到插入的数组索引i,如果tab[i]==null,直接新建节点,添加至数组上
    15     if ((p = tab[i = (n - 1) & hash]) == null)
    16         tab[i] = newNode(hash, key, value, null);
    17     else {
    18         Node<K,V> e; K k;
    19         // 判断tab[i]的首个元素是否和要取的key一样,如果相同直接覆盖value
    20         if (p.hash == hash &&
    21             ((k = p.key) == key || (key != null && key.equals(k))))
    22             e = p;
    23         // 判断tab[i]是否为TreeNode,即是否为红黑树,如果是,在树中处理
    24         else if (p instanceof TreeNode)
    25             e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
    26         // 否则,遍历tab[i]上的链表
    27         else {
    28             for (int binCount = 0; ; ++binCount) {
    29                 // 如果链表的长度大于8,那么将链表转红黑树,在红黑树中执行插入操作
    30                 if ((e = p.next) == null) {
    31                     p.next = newNode(hash, key, value, null);
    32                     if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
    33                         treeifyBin(tab, hash);
    34                     break;
    35                 }
    36                 // 如果发现链表中有相同的key(hash相同、key值也相同)
    37                 if (e.hash == hash &&
    38                     ((k = e.key) == key || (key != null && key.equals(k))))
    39                     break;
    40                 p = e;
    41             }
    42         }
    43 
    44         if (e != null) { // existing mapping for key
    45             V oldValue = e.value;
    46             if (!onlyIfAbsent || oldValue == null)
    47                 e.value = value;
    48             afterNodeAccess(e);
    49             return oldValue;
    50         }
    51     }
    52     // 超过最大容量,就进行扩容
    53     ++modCount;
    54     if (++size > threshold)
    55         resize();
    56     afterNodeInsertion(evict);
    57     return null;
    58 }

      ① 判断键值对数组table[i]是否为空或为null,否则执行resize()进行扩容;

      ② 根据键值key计算hash值得到插入的数组索引i,如果table[i]==null,直接新建节点添加,转向⑥,如果table[i]不为空,转向③;

      ③ 判断table[i]的首个元素是否和key一样,如果相同直接覆盖value,否则转向④,这里的相同指的是hashCode以及equals;

      ④ 判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对,否则转向⑤;

      ⑤ 遍历table[i],判断链表长度是否大于8,大于8的话把链表转换为红黑树,在红黑树中执行插入操作,否则进行链表的插入操作;遍历过程中若发现key已经存在直接覆盖value即可;

      ⑥ 插入成功后,判断实际存在的键值对数量size是否超多了最大容量threshold,如果超过,进行扩容。

  • 相关阅读:
    WPF 对Border 边框进行投影
    WPF 自定义可拖动标题栏
    WPF 静态资源(StaticResource)和动态资源(DynamicResource)
    SQL数据分组后取第一条数据——PARTITION BY
    驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:“The server selected protocol version TLS10 is not accepted by client
    Windows 安装 MySQL 5.7 x64 位
    kubeadm init port is in use
    SQL Server 2016 安装
    驼峰下划线互转
    使用 Kubeadm 部署 Kubernetes(K8S) 安装
  • 原文地址:https://www.cnblogs.com/zhengbin/p/6388089.html
Copyright © 2020-2023  润新知