原文链接:https://www.cnblogs.com/chenpi/p/5614290.html
什么是任务:
实现Callable接口或Runnable接口的类,其实例就可以成为一个任务提交给ExecutorService去执行;
其中Callable任务可以返回执行结果,Runnable任务无返回结果;
Executor框架(线程池、 Callable 、Future)
什么是Executor框架
简单的说,就是一个任务的执行和调度框架,涉及的类如下图所示:
其中,最顶层是Executor接口,它的定义很简单,一个用于执行任务的execute方法,如下所示:
public interface Executor { void execute(Runnable command); }
另外,我们还可以看到一个Executors类,它是一个工具类(有点类似集合框架的Collections类),用于创建ExecutorService
、ScheduledExecutorService
、ThreadFactory
和 Callable对象。
优点:
任务的提交过程与执行过程解耦,用户只需定义好任务提交,具体如何执行,什么时候执行不需要关心;
典型步骤:
定义好任务(如Callable对象),把它提交给ExecutorService(如线程池)去执行,得到Future对象,然后调用Future的get方法等待执行结果即可。
什么是线程池
通过Executors工具类可以创建各种类型的线程池,如下为常见的四种:
- newCachedThreadPool :大小不受限,当线程释放时,可重用该线程;
- newFixedThreadPool :大小固定,无可用线程时,任务需等待,直到有可用线程;
- newSingleThreadExecutor :创建一个单线程,任务会按顺序依次执行;
- newScheduledThreadPool:创建一个定长线程池,支持定时及周期性任务执行
简单小示例
ExecutorService executor = Executors.newCachedThreadPool();//创建线程池 Task task = new Task(); //创建Callable任务 Future<Integer> result = executor.submit(task);//提交任务给线程池执行 result.get();//等待执行结果; 可以传入等待时间参数,指定时间内没返回的话,直接结束
ThreadPoolExecutor管理的线程数量是有界的。为解决最大线程数的问题,引入了排队机制。J.U.C提供的ThreadPoolExecutor只支持任务在内存中排队,通过BlockingQueue暂存还没有来得及执行的任务。
一
ThreadPoolExecutor与线程相关的几个成员变量是:keepAliveTime、allowCoreThreadTimeOut、poolSize、corePoolSize、maximumPoolSize,它们共同负责线程的创建和销毁。
corePoolSize:
线程池的基本大小,即在没有任务需要执行的时候线程池的大小,并且只有在工作队列满了的情况下才会创建超出这个数量的线程。
需要注意的是:在刚刚创建ThreadPoolExecutor的时候,线程并不会立即启动,而是要等到有任务提交时才会启动,除非调用了prestartCoreThread/prestartAllCoreThreads事先启动核心线程。再考虑到keepAliveTime和allowCoreThreadTimeOut超时参数的影响,所以没有任务需要执行的时候,线程池的大小不一定是corePoolSize。
maximumPoolSize:
线程池中允许的最大线程数,线程池中的当前线程数目不会超过该值。如果队列中任务已满,并且当前线程个数小于maximumPoolSize,那么会创建新的线程来执行任务。这里值得一提的是largestPoolSize,该变量记录了线程池在整个生命周期中曾经出现的最大线程个数。线程池创建之后,可以调用setMaximumPoolSize()改变运行的最大线程的数目。
poolSize:
线程池中当前线程的数量,当该值为0的时候,意味着没有任何线程,线程池会终止;同一时刻,poolSize不会超过maximumPoolSize。
新提交一个任务时的处理流程:
1、如果线程池的当前大小还没有达到基本大小(poolSize < corePoolSize),那么就新增加一个线程处理新提交的任务;
2、如果当前大小已经达到了基本大小,就将新提交的任务提交到阻塞队列排队,等候处理workQueue.offer(command);
3、如果队列容量已达上限,并且当前大小poolSize没有达到maximumPoolSize,那么就新增线程来处理任务;
4、如果队列已满,并且当前线程数目也已经达到上限,那么意味着线程池的处理能力已经达到了极限,此时需要拒绝新增加的任务。至于如何拒绝处理新增
的任务,取决于线程池的饱和策略RejectedExecutionHandler。
二
通过corePoolSize和maximumPoolSize,控制如何新增线程;通过allowCoreThreadTimeOut和keepAliveTime,控制如何销毁线程。
allowCoreThreadTimeOut:
该属性用来控制是否允许核心线程超时退出。If false,core threads stay alive even when idle.If true, core threads use keepAliveTime to time out waiting for work。如果线程池的大小已经达到了corePoolSize,不管有没有任务需要执行,线程池都会保证这些核心线程处于存活状态。可以知道:该属性只是用来控制核心线程的。
keepAliveTime:
如果一个线程处在空闲状态的时间超过了该属性值,就会因为超时而退出。举个例子,如果线程池的核心大小corePoolSize=5,而当前大小poolSize =8,那么超出核心大小的线程,会按照keepAliveTime的值判断是否会超时退出。如果线程池的核心大小corePoolSize=5,而当前大小poolSize =5,那么线程池中所有线程都是核心线程,这个时候线程是否会退出,取决于allowCoreThreadTimeOut。
补充:批量任务的执行方式
方式一:首先定义任务集合,然后定义Future集合用于存放执行结果,执行任务,最后遍历Future集合获取结果;
- 优点:可以依次得到有序的结果;
- 缺点:不能及时获取已完成任务的执行结果;
方式二:首先定义任务集合,通过CompletionService包装ExecutorService,执行任务,然后调用其take()方法去取Future对象
- 优点:及时得到已完成任务的执行结果
- 缺点:不能依次得到结果
这里稍微解释下,在方式一中,从集合中遍历的每个Future对象并不一定处于完成状态,这时调用get()方法就会被阻塞住,所以后面的任务即使已完成也不能得到结果;而方式二中,CompletionService的实现是维护一个保存Future对象的BlockingQueue,只有当这个Future对象状态是结束的时候,才会加入到这个Queue中,所以调用take()能从阻塞队列中拿到最新的已完成任务的结果;
AbstractQueuedSynchronizer (AQS框架)
什么是AQS框架
AQS框架是J.U.C中实现锁及同步机制的基础,其底层是通过调用 LockSupport .unpark()和 LockSupport .park()实现线程的阻塞和唤醒。
AbstractQueuedSynchronizer是一个抽象类,主要是维护了一个int类型的state属性和一个非阻塞、先进先出的线程等待队列;其中state是用volatile修饰的,保证线程之间的可见性,队列的入队和出对操作都是无锁操作,基于自旋锁和CAS实现;另外AQS分为两种模式:独占模式和共享模式,像ReentrantLock是基于独占模式模式实现的,CountDownLatch、CyclicBarrier等是基于共享模式。
简单举个例子
非公平锁的lock方法的实现:
final void lock() { //CAS操作,如果State为0(表示当前没有其它线程占有该锁),则将它设置为1 if (compareAndSetState(0, 1)) setExclusiveOwnerThread(Thread.currentThread()); else acquire(1); }
首先是不管先后顺序,直接尝试获取锁(非公平的体现),成功的话,直接独占访问;
如果获取锁失败,则调用AQS的acquire方法,在该方法内部会调用tryAcquire方法再次尝试获取锁以及是否可重入判断,如果失败,则挂起当前线程并加入到等待队列;
具体可查看ReentrantLock.NonfairSync类和AbstractQueuedSynchronizer类对应的源码。
Locks & Condition(锁和条件变量)
先看一下Lock接口提供的主要方法,如下:
- lock() 等待获取锁
- lockInterruptibly() 可中断等待获取锁,synchronized无法实现可中断等待
- tryLock() 尝试获取锁,立即返回true或false
- tryLock(long time, TimeUnit unit) 指定时间内等待获取锁
- unlock() 释放锁
- newCondition() 返回一个绑定到此
Lock
实例上的Condition
实例
关于Lock接口的实现,我们主要是关注以下两个类:
- ReentrantLock
- ReentrantReadWriteLock
ReentrantLock
可重入锁,所谓的可重入锁,也叫递归锁,是指一个线程获取锁后,再次获取该锁时,不需要重新等待获取。ReentrantLock分为公平锁和非公平锁,公平锁指的是严格按照先来先得的顺序排队等待去获取锁,而非公平锁每次获取锁时,是先直接尝试获取锁,获取不到,再按照先来先得的顺序排队等待。
注意:ReentrantLock和synchronized都是可重入锁。
ReentrantReadWriteLock
可重入读写锁,指的是没有线程进行写操作时,多个线程可同时进行读操作,当有线程进行写操作时,其它读写操作只能等待。即“读-读能共存,读-写不能共存,写-写不能共存”。
在读多于写的情况下,读写锁能够提供比排它锁更好的并发性和吞吐量。
Condition
Condition对象是由Lock对象创建的,一个Lock对象可以创建多个Condition,其实Lock和Condition都是基于AQS实现的。
Condition对象主要用于线程的等待和唤醒,在JDK 5之前,线程的等待唤醒是用Object对象的wait/notify/notifyAll方法实现的,使用起来不是很方便;
在JDK5之后,J.U.C包提供了Condition,其中:
Condition.await对应于Object.wait;
Condition.signal 对应于 Object.notify;
Condition.signalAll 对应于 Object.notifyAll;
使用Condition对象有一个比较明显的好处是一个锁可以创建多个Condition对象,我们可以给某类线程分配一个Condition,然后就可以唤醒特定类的线程。
Synchronizers(同步器)
J.U.C中的同步器主要用于协助线程同步,有以下四种:
- 闭锁 CountDownLatch
- 栅栏 CyclicBarrier
- 信号量 Semaphore
- 交换器 Exchanger
闭锁 CountDownLatch
闭锁主要用于让一个主线程等待一组事件发生后继续执行,这里的事件其实就是指CountDownLatch对象的countDown方法。注意其它线程调用完countDown方法后,是会继续执行的,具体如下图所示:
在CountDownLatch内部,包含一个计数器,一开始初始化为一个整数(事件个数),发生一个事件后,调用countDown方法,计数器减1,await用于等待计数器为0后继续执行当前线程;
如上图:TA主线程会一直等待,直到计数cnt=0,才继续执行,
可参照之前写的一篇文章,如下链接,里面有一个闭锁的demo示例。
http://www.cnblogs.com/chenpi/p/5358579.html
栅栏 CyclicBarrier
栅栏主要用于等待其它线程,且会阻塞自己当前线程,所有线程必须同时到达栅栏位置后,才能继续执行;且在所有线程到达栅栏处,可以触发执行另外一个预先设置的线程,具体如下图所示:
在上图中,T1、T2、T3每调用一次await,计数减减,且在它们调用await方法的时候,如果计数不为0,会阻塞自己的线程;
另外,TA线程会在所有线程到达栅栏处(计数为0)的时候,才开始执行;
可参照之前写的一篇文章,如下链接,里面有一个栅栏的demo示例。
http://www.cnblogs.com/chenpi/p/5358579.html
信号量Semaphore
信号量主要用于控制访问资源的线程个数,常常用于实现资源池,如数据库连接池,线程池...
在Semaphore中,acquire方法用于获取资源,有的话,继续执行(使用结束后,记得释放资源),没有资源的话将阻塞直到有其它线程调用release方法释放资源;
可参照之前写的一篇文章,如下链接,里面有一个信号量的demo示例。
http://www.cnblogs.com/chenpi/p/5358579.html
交换器 Exchanger
交换器主要用于线程之间进行数据交换;
当两个线程都到达共同的同步点(都执行到exchanger.exchange的时刻)时,发生数据交换,否则会等待直到其它线程到达;
Atomic Variables(原子变量)
原子变量主要是方便程序员在多线程环境下,无锁的进行原子操作;
原子类是基于Unsafe实现的包装类,核心操作是CAS原子操作;所谓的CAS操作,即compare and swap,指的是将预期值与当前变量的值比较(compare),如果相等则使用新值替换(swap)当前变量,否则不作操作;我们可以摘取一段AtomicInteger的源码,如下:
public final boolean compareAndSet(int expect, int update) { return unsafe.compareAndSwapInt(this, valueOffset, expect, update); }
在compareAndSwapInt方法中,valueOffset是内存地址,expect是预期值,update是更新值,如果valueOffset地址处的值与预期值相等,则将valueOffset地址处的值更新为update值。PS:现代CPU已广泛支持CAS指令;
在Java中,有四种原子更新方式,如下:
- 原子方式更新基本类型; AtomicInteger 、 AtomicLong 等
- 原子方式更新数组; AtomicIntegerArray、 AtomicLongArray等
- 原子方式更新引用; AtomicReference、 AtomicReferenceFieldUpdater…
- 原子方式更新字段; AtomicIntegerFieldUpdater、 AtomicStampedReference(解决CAS的ABA问题)…
更多关于原子变量,可以参考之前写的三篇文章:
atomic包 :http://www.cnblogs.com/chenpi/p/5375805.html
AtomicInteger源码注释:http://www.cnblogs.com/chenpi/p/5357136.html
理解sun.misc.Unsafe:http://www.cnblogs.com/chenpi/p/5389254.html
提个醒:简单的自增操作,如i++,并不是一个原子操作,不过使用原子变量类进行操作,如调用incrementAndGet()方法进行自增,可以使其成为原子操作;
BlockingQueue(阻塞队列)
阻塞队列提供了可阻塞的入队和出对操作,如果队列满了,入队操作将阻塞直到有空间可用,如果队列空了,出队操作将阻塞直到有元素可用;
在Java中,主要有以下类型的阻塞队列:
- ArrayBlockingQueue :一个由数组结构组成的有界阻塞队列。
- LinkedBlockingQueue :一个由链表结构组成的有界阻塞队列。
- PriorityBlockingQueue :一个支持优先级排序的无界阻塞队列。
- DelayQueue:一个支持延时获取元素的无界阻塞队列。
- SynchronousQueue:一个不存储元素的阻塞队列。
- LinkedTransferQueue:一个由链表结构组成的无界阻塞队列。
- LinkedBlockingDeque:一个由链表结构组成的双向阻塞队列。
阻塞队列有一个比较典型的应用场景是解决生产者-消费者问题,具体可以参考之前写的一篇文章,里面有demo示例:
使用阻塞队列解决生产者-消费者问题 : http://www.cnblogs.com/chenpi/p/5553325.html
Concurrent Collections(并发容器)
接下来,我们来看一下工作中比较常见的一块内容,并发容器;
说到并发容器,不得不提同步容器,在JDK5之前,为了线程安全,我们一般都是使用同步容器,同步容器主要有以下缺点:
- 同步容器对所有容器状态的访问都串行化,严重降低了并发性;
- 某些复合操作,仍然需要加锁来保护
- 迭代期间,若其它线程并发修改该容器,会抛出ConcurrentModificationException异常,即快速失败机制
对于复合操作,我们可以举个例子, 因为比较容易被忽视,如下代码:
public static Integer getLast(Vector<Integer> list){ int lastIndex = list.size() - 1; if(lastIndex < 0) return null; return list.get(lastIndex); }
在以上代码中,虽然list集合是Vector类型,但该方法仍然不是原子操作,因为在list.size()和list.get(lastIndex)之间,可能已经发生了很多事。
那么,在JDK 5之后,有哪些并发容器呢,这里主要说两种,如下:
- ConcurrentHashMap
- CopyOnWriteArrayList/Set
ConcurrentHashMap
ConcurrentHashMap是采用分离锁技术,在同步容器中,是一个容器一个锁,但在ConcurrentHashMap中,会将hash表的数组部分分成若干段,每段维护一个锁;这些段可以并发的进行写操作,以达到高效的并发访问,如下图示例:
另外,性能是我们比较关心的,我们可以与同步容器做个对比,如下图所示,PS:该图资料来自参考内容~,我自身没做过测试:
CopyOnWriteArrayList/Set
也叫拷贝容器,指的是写数据的时候,重新拷贝一份进行写操作,完成后,再将原容器的引用指向新的拷贝容器。
适用情况:当读操作远远大于写操作的时候,考虑用这个并发集合。
Fork/Join并行计算框架
这块内容是在JDK7中引入的,个人觉得相当牛逼,可以方便利用多核平台的计算能力,简化并行程序的编写,开发人员仅需关注如何划分任务和组合中间结果。
fork/join框架的核心是ForkJoinPool类,实现了工作窃取算法(对那些处理完自身任务的线程,会从其它线程窃取任务执行)并且能够执行 ForkJoinTask任务。
其实对于使用fork/join框架的开发人员来说,主要任务还是在于任务划分,可以参考如下伪代码:
if (任务足够小){ 直接执行该任务; }else{ 将任务拆分成多个子任务; 执行这些子任务并等待结果; }
具体可以参考之前写的一篇文章,里面有一个使用fork/join框架进行图片水平模糊的例子:
TimeUnit枚举
TimeUnit是java.util.concurrent包下面的一个枚举类,TimeUnit提供了可读性更好的线程暂停操作。
在JDK5之前,一般我们暂停线程是这样写的:
Thread.sleep(2400000)//可读性差
可读性相当的差,一眼看去,不知道睡了多久;
在JDK5之后,我们可以这样写:
TimeUnit.SECONDS.sleep(4); TimeUnit.MINUTES.sleep(4); TimeUnit.HOURS.sleep(1); TimeUnit.DAYS.sleep(1);
清晰明了;
另外,TimeUnit还提供了便捷方法用于把时间转换成不同单位,例如,如果你想把秒转换成毫秒,你可以使用下面代码
TimeUnit.SECONDS.toMillis(44);// 44,000
参考资料
《并发编程实战》
《JAVA 编程思想-4版》
谷歌,百度
并发编程网
http://howtodoinjava.com/category/core-java/multi-threading/
http://www.infoq.com/cn/articles/jdk1.8-abstractqueuedsynchronizer
https://zh.wikipedia.org/wiki/JCP
http://geekrai.blogspot.com/2013/07/executor-framework-in-java.html