HashMap的数据结构:数组+链表+红黑树;Java7中的HashMap只由数组+链表构成;Java8引入了红黑树,提高了HashMap的性能;借鉴一张图来说明,原文:https://www.jianshu.com/p/8324a34577a0
下面简单说一下存储过程:
1.接受传入的参数,通过key计算hash值,得到数组下标位置;未发生hash碰撞,直接插入结束;发生hash碰撞,走第2步;
2.判断当前数据节点是红黑树还是链表,如果是链表,将数据放入链表头节点,原数据往后移;如果是红黑树,走第3步;
3.直接在红黑树插入数据结束;
HashMap数组元素和链表使用Node类实现,同Java7中使用Entry类实现是一样的,只是换了名字而已;Node是HashMap静态内部类,实现了Map.Entry接口;同样有以下4个重要属性:
final int hash; // 哈希值,HashMap根据该值确定记录的位置
final K key; // key
V value; // value
Node<K,V> next;// 链表下一个节点
红黑树采用的是TreeNode类实现,它继承了LinkedHashMap.Entry类
下面是HasMap的一些重要参数:
/** * 主要参数 同 JDK 1.7 * 即:容量、加载因子、扩容阈值(要求、范围均相同) */ // 1. 容量(capacity): 必须是2的幂 & <最大容量(2的30次方) static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // 默认容量 = 16 = 1<<4 = 00001中的1向左移4位 = 10000 = 十进制的2^4=16 static final int MAXIMUM_CAPACITY = 1 << 30; // 最大容量 = 2的30次方(若传入的容量过大,将被最大值替换) // 2. 加载因子(Load factor):HashMap在其容量自动增加前可达到多满的一种尺度 final float loadFactor; // 实际加载因子 static final float DEFAULT_LOAD_FACTOR = 0.75f; // 默认加载因子 = 0.75 // 3. 扩容阈值(threshold):当哈希表的大小 ≥ 扩容阈值时,就会扩容哈希表(即扩充HashMap的容量) // a. 扩容 = 对哈希表进行resize操作(即重建内部数据结构),从而哈希表将具有大约两倍的桶数 // b. 扩容阈值 = 容量 x 加载因子 int threshold; // 4. 其他 transient Node<K,V>[] table; // 存储数据的Node类型 数组,长度 = 2的幂;数组的每个元素 = 1个单链表 transient int size;// HashMap的大小,即 HashMap中存储的键值对的数量 /** * 与红黑树相关的参数 */ // 1. 桶的树化阈值:即 链表转成红黑树的阈值,在存储数据时,当链表长度 > 该值时,则将链表转换成红黑树 static final int TREEIFY_THRESHOLD = 8; // 2. 桶的链表还原阈值:即 红黑树转为链表的阈值,当在扩容(resize())时(此时HashMap的数据存储位置会重新计算),在重新计算存储位置后,当原有的红黑树内数量 < 6时,则将 红黑树转换成链表 static final int UNTREEIFY_THRESHOLD = 6; // 3. 最小树形化容量阈值:即 当哈希表中的容量 > 该值时,才允许树形化链表 (即 将链表 转换成红黑树) // 否则,若桶内元素太多时,则直接扩容,而不是树形化 // 为了避免进行扩容、树形化选择的冲突,这个值不能小于 4 * TREEIFY_THRESHOLD static final int MIN_TREEIFY_CAPACITY = 64; 作者:Carson_Ho 链接:https://www.jianshu.com/p/8324a34577a0 來源:简书 简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
HashMap的加载因子:
加载因子越大:空间利用越高,扩容前填充的元素越多,put操作较快;但是链表容易过长,hash碰撞几率较大,get操作较慢;
加载因子越小:get操作较快,链表短,hash碰撞几率低;但是空间利用率低,put元素过多会导致频繁扩容,影响性能;
个人觉得我们在使用HashMap的时候,如果预先知道大概要操作的元素数量,最好给一个初始化值,首先尽量避免扩容,其次根据业务场景结合重要参数来设定一些值来提高使用效率;
HashMap的扩容原理:我们都知道Java中数组是无法自动扩容的,HashMap的方法是使用一个新的数组代替原有的数组,对原数组的所有数据进行重新计算插入新数组,之后指向新数组;如果扩容前数组已经达到最大了,那么将直接将阈值设置成最大整形return;
HashMap每次扩容增长一倍,例如HashMap初始容量为16,加载因子0.75,当容量达到12的时候进行扩容,扩容到2的5次幂;