为什么使用线程池
线程使应用能够更加充分合理的协调利用CPU、内存、网络、IO等系统资源。
- 线程的创建需要开辟虚拟机栈、本地方法栈、程序计数器等线程私有的内存空间。
- 在线程销毁的时候需要回收这些系统资源。
- 频繁的创建和销毁线程会浪费大量的系统资源,增加并发编程风险。
- 另外,在服务器负载过大的时候,如何让新的线程等待或者友好的拒绝服务?这些都是线程自身无法解决的。
所以需要线程池协调多个线程,并实现类似主次线程隔离、定时执行、周期执行等任务。
线程池的作用包括:
- 利用线程池管理并复用线程、控制最大并发数等。
- 实现线程任务队列缓存策略和拒绝机制。
- 实现某些和时间相关的功能,如定时执行和周期执行等。
- 隔离线程环境。比如:交易服务和搜索服务在同一台服务器上,分别开启两个线程池,交易线程的资源消耗明显要大;因此,通过配置独立的线程池,将较慢的交易服务和搜素服务隔离开,避免各服务线程相互影响。
线程池构造函数
线程池是怎样创建线程的:
ThreadPoolExecutor构造函数
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {
if (corePoolSize < 0 ||
maximumPoolSize <= 0 ||
maximumPoolSize < corePoolSize ||
keepAliveTime < 0)
throw new IllegalArgumentException();
if (workQueue == null || threadFactory == null || handler == null)
throw new NullPointerException();
this.acc = System.getSecurityManager() == null ?
null :
AccessController.getContext();
this.corePoolSize = corePoolSize;
this.maximumPoolSize = maximumPoolSize;
this.workQueue = workQueue;
this.keepAliveTime = unit.toNanos(keepAliveTime);
this.threadFactory = threadFactory;
this.handler = handler;
}
参数解析:
- corePoolSize表示常驻的核心线程数。如果等于0,则任务执行完之后,没有任何请求进入时销毁线程池的线程;如果大于0,即使本地任务执行完毕,核心线程也不会销毁。这个设置非常关键,设置过大会浪费资源,设置过小会导致频繁的创建或销毁。
- maximumPoolSize表示线程池能够同时容纳同时执行的最大线程数。必须大于或者等于1。如果待执行的线程数大于此值,则会缓存到队列中。如果corePoolSize和maximumPoolSize相等,即为固定大小线程池。
- keepAliveTime表示线程中的线程空闲时间,当空闲时间达到keepAliveTime值时,线程会被销毁,直到只剩下corePoolSize个线程为止,避免浪费内存和句柄资源。在默认情况下,当线程池的线程数大于corePoolSize时,keepAliveTime才会起作用。但是当ThreadPoolExecutor的allowCoreThreadTimeOut变量被设置为true时,核心线程超时后也会被回收。
- TimeUnit表示时间单位。keepAliveTime的时间单位通常是TimeUnit.SECONDS。
- workQueue表示缓存队列。当请求的线程大于corePoolSize时,线程进入BlockingQueue阻塞队列。
- threadFactory表示线程工厂。它用来生产一组相同的任务的线程。线程池的命名是通过个这个factory增加组名前缀来实现的。在虚拟机分析时就可以知道线程任务时那个线程工厂生产的。
- handler表示执行拒绝策略的对象。当workQueue的任务缓存区到达上限之后,并且活动线程数大于maxPoolSize时,线程池通过拒绝策略处理请求,是一种简单的限流保护。友好的拒绝策略可以如下三种:
- 保存到数据库进行削峰填谷。在空闲时再提取出来执行。
- 转向某个提示页面
- 打印日志
Executors解析
从ThreadPoolExecutor构造方法来看,队列、线程池、拒绝处理服务都必须有实例对象。在平时我们经常会通过Executors这个线程池静态工厂创建线程池,它提供了线程池这三个的默认实现。
下面是线程池的相关类图:
ExecutorService接口继承了Executor接口,定义了管理线程任务的方法。ExecutorService的抽象类AbstractExecutorService提供了submit()、invokeAll()等部分方法的实现,但是核心方法Executor.execute()并未在此实现。因为所有的任务都在这个方法里执行,不同的实现会带来不同的执行策略。通过Executors的静态工厂方法可以创建三个线程池的包装对象:ThreadPoolExecutor、ForkJoinPool、ScheduledThreadPoolExecutor。Executors的和新方法有五个:
- Executors.newWorkStealingPool:创建有足够线程的线程池支持给定的并行度,斌通过使用多个队列减少竞争,此构造方法中把CPU的数量设置为默认的并行度。
public static ExecutorService newWorkStealingPool(int parallelism) {
//返回ForkJoinPool对象
return new ForkJoinPool(parallelism, ForkJoinPool.defaultForkJoinWorkerThreadFactory,null, true);
}
- Executors.newCachedThreadPool:maximumPoolSize最大可至Integer.MAX_VALUE,是高度可伸缩的线程池,如果达到这个上限,可定会跑出OOM异常。KeepAliveTime默认为60秒,工作线程处于空闲状态则回收工作线程。如果任务数增加,在此创建出新线程处理任务。
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,60L, TimeUnit.SECONDS,new SynchronousQueue<Runnable>());
}
- Executors.newScheduledThreadPool:线程数最大可至Integer.MAX_VALUE,与上述相同,存在OOM风险。它是ScheduledExecutorService接口家族的实现类,支持定时任务和周期性任务执行。相比Timer,ScheduledExecutorService更安全,功能更强大,与newCachedThreadPool相比区别是不回收工作线程。
public ScheduledThreadPoolExecutor(int corePoolSize,ThreadFactory threadFactory) {
super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,new DelayedWorkQueue(), threadFactory);
}
- Executors.newSingleThreadScheduledExecutor:创建一个单线程的线程池,相当于单线程串行执行所有任务,保证按照任务的提交顺序依次执行。
- Executors.newFixedThreadPool:输入的参数即固定的线程数,既是核心线程也是最大线程数,
不存在空闲线程,所以keepAliveTime等于0:
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,0L, TimeUnit.MILLISECONDS,new LinkedBlockingQueue<Runnable>());
}
缺陷:
- 首先来看一下LinkedBlockingQueue的构造方法:
public LinkedBlockingQueue() {
this(Integer.MAX_VALUE);
}
public LinkedBlockingQueue(int capacity) {
if (capacity <= 0) throw new IllegalArgumentException();
this.capacity = capacity;
last = head = new Node<E>(null);
}
这里capacity等于Integer.MAX_VALUE,使用这样的额无界队列,如果瞬间请求非常大,会有OOM风险。除了newWorkStealingPool,其他四个创建方式都存在资源耗尽的风险。
- 默认的线程工厂过于简单,线程工厂需要做创建前的准备工作,对线程池的创建必须明确标识,为线程本身指定有意义的名称和简单的序列号。
public class UserThreadFactory implements ThreadFactory {
private final String namePrefix;
private final AtomicInteger nextID = new AtomicInteger(1);
public UserThreadFactory(String whatFeatureOfGroup) {namePrefix = "UserThreadFactory's " + whatFeatureOfGroup + "-Worker-";}
@Override
public Thread newThread(Runnable r) {
String name=namePrefix+nextID.getAndIncrement();
Thread thread = new Thread(null, r, name, 0);
System.out.println(thread.getName());
return thread;
}
}
- 拒绝策略应该考虑到业务场景,返回相应的提示或者友好的跳转。
在ThreadPoolExecutor中提供了四个公开的内部静态类:- AbortPolicy(默认):丢弃任务并抛出RejectedExecutionException异常。
- DiscardPolicy:丢弃任务,但是不抛出异常,不推荐此种做法。
- DiscardOldestPolicy:抛弃队列中等待最久的任务,然后把当前任务加入队列中。
- CallerRunsPolicy:调用任务的run()方法绕过线程池直接执行。
线程池源码解析
ThreadPoolExecutor的属性定义
在ThreadPoolExecutor的属性定义中频繁的使用位移运算来表示线程池状态,位移运算是改变当前值的一种高效手段。先来看以下ThreadPoolExecutor的属性定义:
//Integer共有32位,最右边的29位表示工作线程数,最左边3位表示线程池状态
private static final int COUNT_BITS = Integer.SIZE - 3;
//001-00000000000000000000000000000
//111-11111111111111111111111111111 (-1补码)
//000-11111111111111111111111111111,类似于子网掩码,用于位的与运算
private static final int CAPACITY = (1 << COUNT_BITS) - 1;
// 用左边3位,实现五种线程池状态
//10000000000000000000000000000001原码(-1)
//11111111111111111111111111111111补码,左移29位
//111-00000000000000000000000000000 十进制-536,870,912
//此状态表示线程池能够接受新任务
private static final int RUNNING = -1 << COUNT_BITS;
//000-00000000000000000000000000000 十进制0
//此状态不再接受新任务,但可以继续执行队列中的任务
private static final int SHUTDOWN = 0 << COUNT_BITS;
//001-00000000000000000000000000000 十进制536,870,912
//此状态全面拒绝,并中断正在处理的任务
private static final int STOP = 1 << COUNT_BITS;
//010-00000000000000000000000000000 十进制1,073,741,824
//此状态表示所有任务已被终止
private static final int TIDYING = 2 << COUNT_BITS;
//011-00000000000000000000000000000 十进制1,610,612,736
//此状态表示已清理完现场
private static final int TERMINATED = 3 << COUNT_BITS;
//比如 001-00000000000000000000000000011,表示3个工作线程
//掩码取反 111-00000000000000000000000000000,
//与运算 001-00000000000000000000000000000 ,即得到左边3位001,表示线程池当前处于STOP状态
private static int runStateOf(int c) { return c & ~CAPACITY; }
//同理掩码000-11111111111111111111111111111与运算得到右边29位,即工作线程数
private static int workerCountOf(int c) { return c & CAPACITY; }
//把左边3位与右边29位按或运算,合并成一个值
private static int ctlOf(int rs, int wc) { return rs | wc; }
线程池的状态用高3位来表示,其中包括符号位。五种状态按照十进制从小到大依次排序为:
RUNNING < SHUTDOWN < STOP < TIDYING < TERMINATED
这样设计的好处是可以通过比较值的大小来确定线程池的状态。例如:
private static boolean isRunning(int c) {
return c < SHUTDOWN;
}
Executor接口的execute方法
线程池的主要处理流程,总结一下如下图:
public void execute(Runnable command) {
if (command == null)
throw new NullPointerException();
//返回包含线程数及线程池状态的Integer类型数值
int c = ctl.get();
//如果工作线程数小于核心线程数,则创建任务并执行
if (workerCountOf(c) < corePoolSize) {
if (addWorker(command, true))
return;
//如果创建失败,防止外部已经在线程池中加入新任务,重新获取一下
c = ctl.get();
}
//只有线程池处于RUNNING状态,才执行后半句置入队列
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
//如果线程池不是RUNNING状态,则将刚加入队列的任务移除
if (! isRunning(recheck) && remove(command))
reject(command);
//如果之前的线程都被消费完,新建一个线程
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}
//核心池和队列都已满,则尝试创建一个新线程
else if (!addWorker(command, false))
//如果创建失败,则唤醒拒绝策略
reject(command);
}
- execute方法在不同的阶段有三次addWorker的尝试动作
- 发生拒绝的理由有两个:1.线程池状态为非RUNNING。2.等待队列已满
addWorker源码分析
/**
*根据当前线程池的状态,检查是否可以添加新的任务线程,如果可以则创建并启动任务
*如果一切正常返回true。返回失败的可能性如下:
*1.线程池没有处于RUNNING状态
*2.线程工厂创建新的任务线程失败
*
*firstTask:外部启动线程池需要构造的第一个线程,它是线程的母体
*core:新增工作线程时的判断指标:
* true表示新增工作线程时,需要判断当前RUNNING状态的线程是否少于corePoolSize
* false表示新增作线程时,需要判断当前RUNNING状态的线程是否少于maximumPoolSize
*/
private boolean addWorker(Runnable firstTask, boolean core) {
//不需要任务预定义的标签,相应下文的continue retry,快速推出多层嵌套循环
retry:
for (;;) {
//返回包含线程数及线程池状态的数值
int c = ctl.get();
//获取当前线程工作状态
int rs = runStateOf(c);
//判断线程池状态是否不为RUNNING,如果为RUNNING状态则不执行后面的判断
//如果为RUNNING则判断线程池状态不为SHUTDOWN,firstTask 不为null,workQueue为空,则返回false
if (rs >= SHUTDOWN &&
! (rs == SHUTDOWN &&
firstTask == null &&
! workQueue.isEmpty()))
return false;
for (;;) {
//获取当前工作线程数
int wc = workerCountOf(c);
//如果工作线程数大于等于最大容量(2^29)
//或者根据core值判断工作线程数是否大于等于corePoolSize(maximumPoolSize)返回false
if (wc >= CAPACITY ||
wc >= (core ? corePoolSize : maximumPoolSize))
return false;
//将当前活动线程数+1
if (compareAndIncrementWorkerCount(c))
break retry;
//线程池状态和线程数是可变化的,需要经常获取这个最新值
c = ctl.get(); // Re-read ctl
//如果线程池状态发生变化,需要再次从retry标签处进入,再做判断
if (runStateOf(c) != rs)
continue retry;
// else CAS failed due to workerCount change; retry inner loop
}
}
//开始创建工作线程
boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
//通过Worker构造函数中的线程工厂this.thread = getThreadFactory().newThread(this);创建线程,并封装成Worker对象
w = new Worker(firstTask);
final Thread t = w.thread;
if (t != null) {
//在进行ThreadExecutorPool的敏感操作时都需要持有主锁,避免在添加和启动线程时受到干扰
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// Recheck while holding lock.
// Back out on ThreadFactory failure or if
// shut down before lock acquired.
//获取当前线程池的运行状态
int rs = runStateOf(ctl.get());
//当前线程池为RUNNING
//或SHUTDOWN且firstTask为null时
if (rs < SHUTDOWN ||
(rs == SHUTDOWN && firstTask == null)) {
if (t.isAlive()) // precheck that t is startable
throw new IllegalThreadStateException();
workers.add(w);
int s = workers.size();
//整个线程池在运行期间的最大并发任务数
if (s > largestPoolSize)
largestPoolSize = s;
workerAdded = true;
}
} finally {
mainLock.unlock();
}
if (workerAdded) {
//start Worker中的属性对象thread
t.start();
workerStarted = true;
}
}
} finally {
if (! workerStarted)
//线程启动失败,则将当前worker移除、工作计数线程再减回去
addWorkerFailed(w);
}
return workerStarted;
}
Worker部分源码
private final class Worker extends AbstractQueuedSynchronizer implements Runnable{
/** Thread this worker is running in. Null if factory fails. */
final Thread thread;
/** Initial task to run. Possibly null. */
Runnable firstTask;
/** Per-thread task counter */
volatile long completedTasks;
/**
* Creates with given first task and thread from ThreadFactory.
* @param firstTask the first task (null if none)
*/
Worker(Runnable firstTask) {
//AQS方法,在runWorker方法执行之前禁止线程被中断
setState(-1); // inhibit interrupts until runWorker
this.firstTask = firstTask;
this.thread = getThreadFactory().newThread(this);
}
/** Delegates main run loop to outer runWorker */
//当thread被start之后,执行runWorker方法
public void run() {
runWorker(this);
}
}
使用线程池需要注意以下几点:
- 合理设置各类参数,应根据实际业务场景来设置合理的工作线程数。
- 线程资源必须通过线程池提供,不允许在应用中自行显式创建线程。
- 创建线程或线程池时指定有意义的线程名称,方便出错时回溯。
- 不允许使用Executors创建线程池,通过ThreadPoolExecutor方式创建,能明确线程池的运行规则,避免资源耗尽的风险。