正文
1. 概述
java cocurrent包提供了很多并发容器,在提供并发控制的前提下,通过优化,提升性能。本文主要讨论常见的并发容器的实现机制和绝妙之处,但并不会对所有实现细节面面俱到。
2. 为什么JUC需要提供并发容器?
java collection framework提供了丰富的容器,有map、list、set、queue、deque。但是其存在一个不足:多数容器类都是非线程安全的,即使部分容器是线程安全的,由于使用sychronized进行锁控制,导致读/写均需进行锁操作,性能很低。
java collection framework可以通过以下两种方式实现容器对象读写的并发控制,但是都是基于sychronized锁控制机制,性能低:
1. 使用sychronized方法进行并发控制,如HashTable 和 Vector。以下代码为Vector.add(e)的java8实现代码:
public synchronized boolean add(E e) { modCount++; ensureCapacityHelper(elementCount + 1); elementData[elementCount++] = e; return true; }
2.使用工具类Collections将非线程安全容器包装成线程安全容器。以下代码是Collections.synchronizedMap(Map<K,V> m)将原始Map包装为线程安全的SynchronizedMap,但是实际上最终操作时,仍然是在被包装的原始m上进行,只是SynchronizedMap的所有方法都加上了synchronized锁控制。
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) { return new SynchronizedMap<>(m); //将原始Map包装为线程安全的SynchronizedMap }
private static class SynchronizedMap<K,V> implements Map<K,V>, Serializable {SynchronizedMap(Map<K,V> m) { this.m = Objects.requireNonNull(m); mutex = this; }</span><span style="color: #0000ff;">private</span> <span style="color: #0000ff;">final</span> Map<K,V> m; <span style="color: #008000;">//</span><span style="color: #008000;"> Backing Map 原始的非线程安全的map对象</span> <span style="color: #0000ff;">final</span> Object mutex; <span style="color: #008000;">//</span><span style="color: #008000;"> Object on which to synchronize 加锁对象</span>
</span><span style="color: #0000ff;">public</span><span style="color: #000000;"> V get(Object key) { </span><span style="color: #0000ff;">synchronized</span> (mutex) {<span style="color: #0000ff;">return</span><span style="color: #000000;"> m.get(key);} //所有方法加上synchronized锁控制 } </span><span style="color: #0000ff;">public</span><span style="color: #000000;"> V put(K key, V value) { </span><span style="color: #0000ff;">synchronized</span> (mutex) {<span style="color: #0000ff;">return</span><span style="color: #000000;"> m.put(key, value);} //所有方法加上synchronized锁控制 }<br> ......<br> }</span></pre>
为了提供高效地并发容器,java 5在java.util.cocurrent包中 引入了并发容器。
3. JUC并发容器
本节对juc常用的几个并发容器进行代码分析,重点看下这些容器是如何高效地实现并发控制的。在进行具体的并发容器介绍之前,我们提前搞清楚CAS理论是什么东西。因为在juc并发容器的很多地方都使用到了CAS,他比加锁处理更加高效。
CAS
CAS是一种无锁的非阻塞算法,全称为:Compare-and-swap(比较并交换),大致思路是:先比较目标对象现值是否和旧值一致,如果一致,则更新对象为新值;如果不一致,则表明对象已经被其他线程修改,直接返回。算法实现的伪码如下:
function cas(p : pointer to int, old : int, new : int) returns bool { if *p ≠ old { return false } *p ← new return true }
参考自wiki:Compare-and-swap
ConcurrentHashMap
ConcurrentHashMap实现了HashTable的所有功能,线程安全,但却在检索元素时不需要锁定,因此效率更高。
ConcurrentHashMap的key 和 value都不允许null出现。原因在于ConcurrentHashMap不能区分出value是null还是没有map上,相对的HashMap却可以允许null值,在于其使用在单线程环境下,可以使用containKey(key)方法提前判定是否能map上,从而区分这两种情况,但是ConcurrentHashMap在多线程使用上下文中则不能这么判定。参考:关于ConcurrentHashMap为什么不能put null
A hash table supporting full concurrency of retrievals and high expected concurrency for updates. This class obeys the same functional specification as
Hashtable
, and includes versions of methods corresponding to each method ofHashtable
. However, even though all operations are thread-safe, retrieval operations do not entail locking, and there is not any support for locking the entire table in a way that prevents all access. This class is fully interoperable withHashtable
in programs that rely on its thread safety but not on its synchronization details.
ConcurrentHashMap个put和get方法,细节请看代码对应位置的注释。
public V put(K key, V value) { return putVal(key, value, false); }</span><span style="color: #008000;">/**</span><span style="color: #008000;"> Implementation for put and putIfAbsent </span><span style="color: #008000;">*/</span> <span style="color: #0000ff;">final</span> V putVal(K key, V value, <span style="color: #0000ff;">boolean</span><span style="color: #000000;"> onlyIfAbsent) { </span><span style="color: #0000ff;">if</span> (key == <span style="color: #0000ff;">null</span> || value == <span style="color: #0000ff;">null</span>) <span style="color: #0000ff;">throw</span> <span style="color: #0000ff;">new</span><span style="color: #000000;"> NullPointerException(); </span><span style="color: #0000ff;">int</span> hash =<span style="color: #000000;"> spread(key.hashCode()); </span><span style="color: #0000ff;">int</span> binCount = 0<span style="color: #000000;">; </span><span style="color: #0000ff;">for</span> (Node<K,V>[] tab =<span style="color: #000000;"> table;;) { Node</span><K,V> f; <span style="color: #0000ff;">int</span><span style="color: #000000;"> n, i, fh; </span><span style="color: #0000ff;">if</span> (tab == <span style="color: #0000ff;">null</span> || (n = tab.length) == 0<span style="color: #000000;">) tab </span>=<span style="color: #000000;"> initTable(); </span><span style="color: #0000ff;">else</span> <span style="color: #0000ff;">if</span> ((f = tabAt(tab, i = (n - 1) & hash)) == <span style="color: #0000ff;">null</span><span style="color: #000000;">) { </span><span style="color: #0000ff;">if</span> (casTabAt(tab, i, <span style="color: #0000ff;">null</span><span style="color: #000000;">, </span><span style="color: #0000ff;">new</span> Node<K,V>(hash, key, value, <span style="color: #0000ff;">null</span><span style="color: #000000;">))) </span><span style="color: #0000ff;">break</span>; <span style="color: #008000;">//</span><span style="color: #008000;"> no lock when adding to empty bin,<strong>当前hash对应的bin(桶)还不存在时,使用cas写入; 写入失败,则再次尝试。</strong></span>
}
else if ((fh = f.hash) == MOVED) //如果tab[i]不为空并且hash值为MOVED,说明该链表正在进行transfer操作,返回扩容完成后的table
tab = helpTransfer(tab, f);
else {
V oldVal = null;
synchronized (f) { // 加锁保证线程安全,但不是对整个table加锁,只对当前的Node加锁,避免其他线程对当前Node进行写操作。
if (tabAt(tab, i) == f) {
if (fh >= 0) {
binCount = 1;
for (Node<K,V> e = f;; ++binCount) {
K ek;
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) { //如果在链表中找到值为key的节点e,直接设置e.val = value即可
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
Node<K,V> pred = e; //如果没有找到值为key的节点,直接新建Node并加入链表即可
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
else if (f instanceof TreeBin) { //如果首节点为TreeBin类型,说明为红黑树结构,执行putTreeVal操作
Node<K,V> p;
binCount = 2;
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
if (binCount != 0) {
if (binCount >= TREEIFY_THRESHOLD) //如果节点数大于阈值,则转换链表结构为红黑树结构
treeifyBin(tab, i);
if (oldVal != null)
return oldVal;
break;
}
}
}
addCount(1L, binCount); //计数增加1,有可能触发transfer操作(扩容)
return null;
}
transient volatile Node<K,V>[] table; //元素所在的table是volatile类型,线程间可见
public V get(Object key) { //get无需更改size和count等公共属性,加上table是volatile类型,故而无需加锁。 Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek; int h = spread(key.hashCode()); if ((tab = table) != null && (n = tab.length) > 0 && (e = tabAt(tab, (n - 1) & h)) != null) { if ((eh = e.hash) == h) { if ((ek = e.key) == key || (ek != null && key.equals(ek))) return e.val; } else if (eh < 0) return (p = e.find(h, key)) != null ? p.val : null; while ((e = e.next) != null) { if (e.hash == h && ((ek = e.key) == key || (ek != null && key.equals(ek)))) return e.val; } } return null; }
思考一个问题:为什么当新加Node对应的‘桶’不存在时可以直接使用CAS操作新增该桶,并插入新节点,但是当新增Node对应的‘桶’存在时,则必须加锁处理?
参考资料:Java并发编程总结4——ConcurrentHashMap在jdk1.8中的改进
附上HashMap jdk 1.8版本中的实现原理讲解,讲的很细也很通俗易懂:Jdk1.8中的HashMap实现原理
ConcurrentLinkedQueue
ConcurrentLinkedQueue使用链表作为数据结构,它采用无锁操作,可以任务是高并发环境下性能最好的队列。
ConcurrentLinkedQueue是非阻塞线程安全队列,无界,故不太适合做生产者消费者模式,而LinkedBlockingQueue是阻塞线程安全队列,可以做到有界,通常用于生产者消费者模式。
下面看下其offer()方法的源码,体会下:不使用锁,只是用CAS操作来保证线程安全。细节参考代码对应位置的注释。
/**
* 不断尝试:找到最新的tail节点,不断尝试想最新的tail节点后面添加新节点
*/
public boolean offer(E e) { checkNotNull(e); final Node<E> newNode = new Node<E>(e);</span><span style="color: #0000ff;">for</span> (Node<E> t = tail, p =<span style="color: #000000;"> t;;) { //不断尝试:找到最新的tail节点,不断尝试想最新的tail节点后面添加新节点。 Node</span><E> q =<span style="color: #000000;"> p.next; </span><span style="color: #0000ff;">if</span> (q == <span style="color: #0000ff;">null</span><span style="color: #000000;">) { </span><span style="color: #008000;">//</span><span style="color: #008000;"> p is last node</span> <span style="color: #0000ff;">if</span> (p.casNext(<span style="color: #0000ff;">null</span><span style="color: #000000;">, newNode)) { </span><span style="color: #008000;">//</span><span style="color: #008000;"> Successful CAS is the linearization point </span><span style="color: #008000;">//</span><span style="color: #008000;"> for e to become an element of this queue, </span><span style="color: #008000;">//</span><span style="color: #008000;"> and for newNode to become "live".</span> <span style="color: #0000ff;">if</span> (p != t) <span style="color: #008000;">//</span><span style="color: #008000;"> hop two nodes at a time //t引用有可能并不是真实的tail节点的引用,多线程操作时,允许该情况出现,只要能保证每次新增元素是在真实的tail节点上添加的即可。</span> casTail(t, newNode); <span style="color: #008000;">//</span><span style="color: #008000;"> Failure is OK. 即使失败,也不影响下次offer新的元素,反正后面会试图寻找到最新的真实tail元素</span> <span style="color: #0000ff;">return</span> <span style="color: #0000ff;">true</span><span style="color: #000000;">; } </span><span style="color: #008000;">//</span><span style="color: #008000;"> Lost CAS race to another thread; re-read next CAS竞争失败,再次尝试</span>
}
else if (p == q) //遇到哨兵节点(next和item相同,空节点或者删除节点),从head节点重新遍历。确保找到最新的tail节点
// We have fallen off list. If tail is unchanged, it
// will also be off-list, in which case we need to
// jump to head, from which all live nodes are always
// reachable. Else the new tail is a better bet.
p = (t != (t = tail)) ? t : head;
else
// Check for tail updates after two hops.
p = (p != t && t != (t = tail)) ? t : q; //java中'!='运算符不是原子操作,故使用t != (t = tail)做一次判定,如果tail被其他线程更改,则直接使用最新的tail节点返回。
}
}
CopyOnWriteArrayList
CopyOnWriteArrayList提供高效地读取操作,使用在读多写少的场景。CopyOnWriteArrayList读取操作不用加锁,且是安全的;写操作时,先copy一份原有数据数组,再对复制数据进行写入操作,最后将复制数据替换原有数据,从而保证写操作不影响读操作。
下面看下CopyOnWriteArrayList的核心代码,体会下CopyOnWrite的思想:
public class CopyOnWriteArrayList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable { /** The array, accessed only via getArray/setArray. */ private transient volatile Object[] array; /** The lock protecting all mutators */ final transient ReentrantLock lock = new ReentrantLock(); /** * Sets the array. */ final void setArray(Object[] a) { array = a; }</span><span style="color: #008000;">/**</span><span style="color: #008000;"> * Gets the array. Non-private so as to also be accessible * from CopyOnWriteArraySet class. </span><span style="color: #008000;">*/</span> <span style="color: #0000ff;">final</span><span style="color: #000000;"> Object[] getArray() { </span><span style="color: #0000ff;">return</span><span style="color: #000000;"> array; } </span><span style="color: #0000ff;">public</span> E get(<span style="color: #0000ff;">int</span><span style="color: #000000;"> index) { </span><span style="color: #0000ff;">return</span><span style="color: #000000;"> get(getArray(), index); } </span><span style="color: #008000;">/**</span><span style="color: #008000;"> * Appends the specified element to the end of this list. * * </span><span style="color: #808080;">@param</span><span style="color: #008000;"> e element to be appended to this list * </span><span style="color: #808080;">@return</span><span style="color: #008000;"> {</span><span style="color: #808080;">@code</span><span style="color: #008000;"> true} (as specified by {</span><span style="color: #808080;">@link</span><span style="color: #008000;"> Collection#add}) </span><span style="color: #008000;">*/</span> <span style="color: #0000ff;">public</span> <span style="color: #0000ff;">boolean</span><span style="color: #000000;"> add(E e) { </span><span style="color: #0000ff;">final</span> ReentrantLock lock = <span style="color: #0000ff;">this</span><span style="color: #000000;">.lock; lock.lock(); //写 互斥 读 </span><span style="color: #0000ff;">try</span><span style="color: #000000;"> { Object[] elements </span>=<span style="color: #000000;"> getArray(); </span><span style="color: #0000ff;">int</span> len =<span style="color: #000000;"> elements.length; Object[] newElements </span>= Arrays.copyOf(elements, len + 1<span style="color: #000000;">); newElements[len] </span>=<span style="color: #000000;"> e; //对副本进行修改操作 setArray(newElements); //将修改后的副本替换原有的数据 </span><span style="color: #0000ff;">return</span> <span style="color: #0000ff;">true</span><span style="color: #000000;">; } </span><span style="color: #0000ff;">finally</span><span style="color: #000000;"> { lock.unlock(); } }
}
ConcurrentSkipListMap
SkipList(跳表)是一种随机性的数据结构,用于替代红黑树,因为它在高并发的情况下,性能优于红黑树。跳表实际上是以空间换取时间。跳表的基本模型示意图如下:
ConcurrentSkipListMap的实现就是实现了一个无锁版的跳表,主要是利用无锁的链表的实现来管理跳表底层,同样利用CAS来完成替换。