一、为什么要使用线程池
线程池复用线程有以下几点优点:
- 减少资源创建 => 减少内存开销,创建线程占用内存。使用 new Thread 每次启动线程都需要进行对象和线程;
- 降低系统开销 => 创建线程需要时间,会延迟处理的请求;
- 提高稳定稳定性 => 避免无限创建线程引起的 OOM;
- 功能更强大 => 提供了定期执行、线程中断、并发数控制等功能。
二、Executors 创建线程池的方式
根据返回的对象类型创建线程池可以分为三类:
- 创建返回 ThreadPoolExecutor 对象
- 创建返回 ScheduleThreadPoolExecutor 对象
- 创建返回 ForkJoinPool 对象
下面主要讨论一下 ThreadPoolExecutor 对象。
程序示例:
public class N06_Executor {
public static void main(String[] args) {
// ExecutorService threadPool = Executors.newFixedThreadPool(10);
ExecutorService threadPool = Executors.newCachedThreadPool();
for (int i = 0; i < 100; ++i) {
threadPool.execute(() -> {
while (true)
System.out.println(Thread.currentThread().getName() + " running");
});
}
threadPool.shutdown();
}
}
三、ThreadPoolExecutor 对象
1. 构造函数与参数意义
使用 Executors 创建线程池,都会调用 ThreadPoolExecutor 构造函数,只是构造函数的参数不同。ThreadPoolExecutor 的构造函数也有多个,最终都会调用这一个:
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)
构造函数参数说明:
- corePoolSize => 线程池核心线程数量
- maximumPoolSize => 线程池最大数量
- keepAliveTime => 空闲线程存活时间
- unit => 时间单位
- workQueue => 线程池所使用的缓冲队列
- threadFactory => 线程池创建线程使用的工厂
- handler => 线程池对拒绝任务的处理策略
2. 线程池执行任务逻辑和线程池参数的关系
执行逻辑说明:
- 判断核心线程数是否已满,核心线程数大小和 corePoolSize 参数有关,未满则创建线程执行任务
- 若核心线程池已满,判断队列是否满,队列是否满和 workQueue 参数有关,若未满则加入队列中
- 若队列已满,判断线程池是否已满,线程池是否已满和 maximumPoolSize 参数有关,若未满创建线程执行任务
- 若线程池已满,则采用拒绝策略处理无法执执行的任务,拒绝策略和 handler 参数有关
3. Executors 创建返回 ThreadPoolExecutor 对象
Executors 创建返回 ThreadPoolExecutor 对象的方法共有三种:
- Executors#newCachedThreadPool => 创建可缓存的线程池
- Executors#newSingleThreadExecutor => 创建单线程的线程池
- Executors#newFixedThreadPool => 创建固定长度的线程池
(1)Executors#newCachedThreadPool 方法
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
CachedThreadPool 是一个根据需要创建新线程的线程池。
- corePoolSize => 0,核心线程池的数量为0
- maximumPoolSize => Integer.MAX_VALUE,线程池最大数量为Integer.MAX_VALUE,可以认为可以无限创建线程
- keepAliveTime => 60L
- unit => 秒
- workQueue => SynchronousQueue
当一个任务提交时,corePoolSize 为 0 不创建核心线程,SynchronousQueue 是一个不存储元素的队列,可以理解为队里永远是满的,因此最终会创建非核心线程来执行任务。对于非核心线程空闲 60s 时将被回收。因为Integer.MAX_VALUE 非常大,可以认为是可以无限创建线程的,在资源有限的情况下容易引起 OOM 异常。
(2)Executors#newSingleThreadExecutor 方法
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>()));
}
SingleThreadExecutor 是单线程线程池,只有一个核心线程
- corePoolSize => 1,核心线程池的数量为 1
- maximumPoolSize => 1,线程池最大数量为 1,即最多只可以创建一个线程,唯一的线程就是核心线程
- keepAliveTime => 0L
- unit => 毫秒
- workQueue => LinkedBlockingQueue
当一个任务提交时,首先会创建一个核心线程来执行任务,如果超过核心线程的数量,将会放入队列中,因为 LinkedBlockingQueue 是长度为 Integer.MAX_VALUE 的队列,可以认为是无界队列,因此往队列中可以插入无限多的任务,在资源有限的时候容易引起 OOM 异常,同时因为无界队列,maximumPoolSize 和 keepAliveTime 参数将无效,压根就不会创建非核心线程。
(3)Executors#newFixedThreadPool 方法
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
FixedThreadPool 是固定核心线程的线程池,固定核心线程数由用户传入
- corePoolSize => nThreads,核心线程池的数量为1
- maximumPoolSize => nThreads,线程池最大数量为nThreads,即最多只可以创建nThreads个线程
- keepAliveTime => 0L
- unit => 毫秒
- workQueue => LinkedBlockingQueue
它和 SingleThreadExecutor 类似,唯一的区别就是核心线程数不同,并且由于使用的是 LinkedBlockingQueue,在资源有限的时候容易引起 OOM 异常。
(4)总结
- FixedThreadPool 和 SingleThreadExecutor => 允许的请求队列长度为Integer.MAX_VALUE,可能会堆积大量的请求,从而引起 OOM 异常
- CachedThreadPool => 允许创建的线程数为 Integer.MAX_VALUE,可能会创建大量的线程,从而引起 OOM 异常
所以更推荐自己使用 ThreadPoolExecutor 来创建线程池,而不建议使用 Executors 去创建线程池。
如果使用 Executors 的静态方法创建 ThreadPoolExecutor 对象,可以通过使用 Semaphore 对任务的执行进行限流可以避免出现 OOM 异常。
4. 如何定义线程池参数
-
CPU 密集型 => 线程池的大小推荐为 CPU 数量 + 1, CPU 数量可以根据 Runtime.availableProcessors 方法获取
-
IO 密集型 => CPU 数量 * CPU 利用率 * (1 + 线程等待时间/线程 CPU 时间)
-
混合型 => 将任务分为 CPU 密集型和 IO 密集型,然后分别使用不同的线程池去处理,从而使每个线程池可以根据各自的工作负载来调整
-
阻塞队列 => 推荐使用有界队列,有界队列有助于避免资源耗尽的情况发生
-
拒绝策略 => 默认采用的是 AbortPolicy 拒绝策略,直接在程序中抛出 RejectedExecutionException 异常(因为是运行时异常,不强制 catch),这种处理方式不够优雅。处理拒绝策略有以下几种比较推荐:
- 在程序中捕获 RejectedExecutionException 异常,在捕获异常中对任务进行处理。针对默认拒绝策略
- 使用 CallerRunsPolicy 拒绝策略,该策略会将任务交给调用 execute 的线程执行(一般为主线程),此时主线程将在一段时间内不能提交任何任务,从而使工作线程处理正在执行的任务。此时提交的线程将被保存在 TCP 队列中,TCP 队列满将会影响客户端,这是一种平缓的性能降低
- 自定义拒绝策略,只需要实现 RejectedExecutionHandler 接口即可
- 如果任务不是特别重要,使用 DiscardPolicy 和 DiscardOldestPolicy 拒绝策略将任务丢弃也是可以的
四、调度池
public ScheduledThreadPoolExecutor(int corePoolSize) {
super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
new DelayedWorkQueue());
}
- corePoolSize => 自定义
- maximumPoolSize => Integer.MAX_VALUE
- keepAliveTime => 0
- workQueue => DelayedWorkQueue
方法:
schedule(Callable<V> callable, long delay, TimeUnit unit)
创建并执行并销毁一个 callable 在延迟指定 delay 时间后- 同上,callable 换成了 runnable
scheduleAtFixedRate(Runnable command, long initialDelay, long period, TimeUnit unit)
创建并执行并结束一个 runnable 在延迟指定 initialDelay 时间,然后每隔 initialDelay + period * n 时间执行一次scheduleWithFixedDelay(Runnable command, long initialDelay, long delay, TimeUnit unit)
创建并执行并结束一个 runnable 在延迟指定 initialDelay 时间,然后第一次执行完成后,间隔 delay 时间继续执行一次,无限循环。
程序示例:
public class N06_Executor {
public static void main(String[] args) {
ScheduledExecutorService executorService = Executors.newScheduledThreadPool(3);
// 延迟 3s,每隔1s执行一次
executorService.scheduleAtFixedRate(() -> System.out.println("hello world"), 3, 1, TimeUnit.SECONDS);
// 延迟 3s 执行
// executorService.schedule(() -> System.out.println("hello world"), 3, TimeUnit.SECONDS);
// executorService.shutdown();
}
}
参考:
- 为什么阿里巴巴要禁用Executors创建线程池?
- Java多线程与高并发(五):线程池
- 《Java并发编程的艺术》