写在前面:
先解释下何为尾插法。大家都知道HashMap在JDK1.8版本经过优化之后,整体的数据结构变成了数组+链表+红黑树这样的形式。而尾插法说的就是在往HashMap里面put元素时,数组桶位上面还是未转化为红黑树的链表,此时新增在链表上元素的位置为链表尾部,故名尾插法。
前面聊了HashMap在JDK1.7版本的头插法实现,现在看看HashMap到了JDK1.8版本升级之后的变化。
先上代码:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
平时java代码都是调的这个方法,实际实现是putVal(hash(key), key, value, false, true):
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 数组是否未初始化?若未初始化则进行初始化
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// key的hash值经过位运算之后再和数组长度-1得到的值运算得到key在数组的下标
// 若数组的这个位置还没有元素则直接将key-value放进去
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
// 若该下标位置已有元素
Node<K,V> e; K k;
// 是否已有元素的key值与新增元素的key判断是同一个
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
// 直接覆盖value
e = p;
// 如果已有元素是树节点
else if (p instanceof TreeNode)
// 将插入的元素新增为树节点
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// 不是树节点则只能是链表节点了,还未转化为树
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
// 遍历元素新增链表节点,此时可看该方法具体实现
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
/**
* 删除部分代码
*/
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
接下来看 p.next = newNode(hash, key, value, null)这一句的具体方法实现,这也是HashMap在JDK1.8尾插法的实现了:
Node<K,V> newNode(int hash, K key, V value, Node<K,V> next) {
return new Node<>(hash, key, value, next);
}
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
在这个方法里面,构造了一个新节点Node(JDK1.8的新实现,继承自Entry<K,V>),后继节点指向null说明它在链表的位置后面是没有元素的。
而在p.next = newNode(hash, key, value, null)这一句,是将新构造的Node节点指向原来遍历链表查找到的最后一个元素的后继节点。最终的效果其实就是将新元素追加到链表的尾部了,这也就是HashMap在JDK1.8的尾插法。
稍微提几点:
1、在上一篇文章中提到链表遍历查找元素是比较慢的,在HashMap中put元素发现数组桶位上已有元素,接着遍历桶位上的链表查找是否有相同key的过程称为hash碰撞,这是比较耗性能的。
而为了避免链表过长遍历时间过大的问题,在JDK1.8采用了数据+链表+红黑树的结构。在往链表上新增元素时发现链表长度超过8时,会进入链表转红黑树的方法,然后再判断数组长度是否不小于64,若满足条件则将链表转化为红黑树。
2、至于JDK1.8的链表插入元素为什么改为了尾插法,则是为了避免出现逆序且链表死循环的问题(JDK1.7的HashMap扩容导致死循环了解哈)。