Java并发编程05-线程池

Java并发编程05-线程池
一、为什么要使用线程池

线程池复用线程有以下几点优点：
- 减少资源创建 => 减少内存开销，创建线程占用内存。使用 new Thread 每次启动线程都需要进行对象和线程；
- 降低系统开销 => 创建线程需要时间，会延迟处理的请求；
- 提高稳定稳定性 => 避免无限创建线程引起的 OOM；
- 功能更强大 => 提供了定期执行、线程中断、并发数控制等功能。
二、Executors 创建线程池的方式

根据返回的对象类型创建线程池可以分为三类：
- 创建返回 ThreadPoolExecutor 对象
- 创建返回 ScheduleThreadPoolExecutor 对象
- 创建返回 ForkJoinPool 对象
下面主要讨论一下 ThreadPoolExecutor 对象。

程序示例：
```
public class N06_Executor {

    public static void main(String[] args) {
//        ExecutorService threadPool = Executors.newFixedThreadPool(10);
        ExecutorService threadPool = Executors.newCachedThreadPool();

        for (int i = 0; i < 100; ++i) {
            threadPool.execute(() -> {
                while (true)
                    System.out.println(Thread.currentThread().getName() + " running");
            });
        }

        threadPool.shutdown();
    }
}
```
三、ThreadPoolExecutor 对象

1. 构造函数与参数意义

使用 Executors 创建线程池，都会调用 ThreadPoolExecutor 构造函数，只是构造函数的参数不同。ThreadPoolExecutor 的构造函数也有多个，最终都会调用这一个：
```
public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler)
```
构造函数参数说明：
- corePoolSize => 线程池核心线程数量
- maximumPoolSize => 线程池最大数量
- keepAliveTime => 空闲线程存活时间
- unit => 时间单位
- workQueue => 线程池所使用的缓冲队列
- threadFactory => 线程池创建线程使用的工厂
- handler => 线程池对拒绝任务的处理策略
2. 线程池执行任务逻辑和线程池参数的关系

执行逻辑说明：
- 判断核心线程数是否已满，核心线程数大小和 corePoolSize 参数有关，未满则创建线程执行任务
- 若核心线程池已满，判断队列是否满，队列是否满和 workQueue 参数有关，若未满则加入队列中
- 若队列已满，判断线程池是否已满，线程池是否已满和 maximumPoolSize 参数有关，若未满创建线程执行任务
- 若线程池已满，则采用拒绝策略处理无法执执行的任务，拒绝策略和 handler 参数有关
3. Executors 创建返回 ThreadPoolExecutor 对象

Executors 创建返回 ThreadPoolExecutor 对象的方法共有三种：
- Executors#newCachedThreadPool => 创建可缓存的线程池
- Executors#newSingleThreadExecutor => 创建单线程的线程池
- Executors#newFixedThreadPool => 创建固定长度的线程池
（1）Executors#newCachedThreadPool 方法
```
public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                  60L, TimeUnit.SECONDS,
                                  new SynchronousQueue<Runnable>());
}
```
CachedThreadPool 是一个根据需要创建新线程的线程池。
- corePoolSize => 0，核心线程池的数量为0
- maximumPoolSize => Integer.MAX_VALUE，线程池最大数量为Integer.MAX_VALUE，可以认为可以无限创建线程
- keepAliveTime => 60L
- unit => 秒
- workQueue => SynchronousQueue
当一个任务提交时，corePoolSize 为 0 不创建核心线程，SynchronousQueue 是一个不存储元素的队列，可以理解为队里永远是满的，因此最终会创建非核心线程来执行任务。对于非核心线程空闲 60s 时将被回收。因为Integer.MAX_VALUE 非常大，可以认为是可以无限创建线程的，在资源有限的情况下容易引起 OOM 异常。

（2）Executors#newSingleThreadExecutor 方法
```
public static ExecutorService newSingleThreadExecutor() {
    return new FinalizableDelegatedExecutorService
        (new ThreadPoolExecutor(1, 1,
                                0L, TimeUnit.MILLISECONDS,
                                new LinkedBlockingQueue<Runnable>()));
}
```
SingleThreadExecutor 是单线程线程池，只有一个核心线程
- corePoolSize => 1，核心线程池的数量为 1
- maximumPoolSize => 1，线程池最大数量为 1，即最多只可以创建一个线程，唯一的线程就是核心线程
- keepAliveTime => 0L
- unit => 毫秒
- workQueue => LinkedBlockingQueue
当一个任务提交时，首先会创建一个核心线程来执行任务，如果超过核心线程的数量，将会放入队列中，因为 LinkedBlockingQueue 是长度为 Integer.MAX_VALUE 的队列，可以认为是无界队列，因此往队列中可以插入无限多的任务，在资源有限的时候容易引起 OOM 异常，同时因为无界队列，maximumPoolSize 和 keepAliveTime 参数将无效，压根就不会创建非核心线程。

（3）Executors#newFixedThreadPool 方法
```
public static ExecutorService newFixedThreadPool(int nThreads) {
   return new ThreadPoolExecutor(nThreads, nThreads,
                                 0L, TimeUnit.MILLISECONDS,
                                 new LinkedBlockingQueue<Runnable>());
}
```
FixedThreadPool 是固定核心线程的线程池，固定核心线程数由用户传入
- corePoolSize => nThreads，核心线程池的数量为1
- maximumPoolSize => nThreads，线程池最大数量为nThreads，即最多只可以创建nThreads个线程
- keepAliveTime => 0L
- unit => 毫秒
- workQueue => LinkedBlockingQueue
它和 SingleThreadExecutor 类似，唯一的区别就是核心线程数不同，并且由于使用的是 LinkedBlockingQueue，在资源有限的时候容易引起 OOM 异常。

（4）总结
- FixedThreadPool 和 SingleThreadExecutor => 允许的请求队列长度为Integer.MAX_VALUE，可能会堆积大量的请求，从而引起 OOM 异常
- CachedThreadPool => 允许创建的线程数为 Integer.MAX_VALUE，可能会创建大量的线程，从而引起 OOM 异常
所以更推荐自己使用 ThreadPoolExecutor 来创建线程池，而不建议使用 Executors 去创建线程池。

如果使用 Executors 的静态方法创建 ThreadPoolExecutor 对象，可以通过使用 Semaphore 对任务的执行进行限流可以避免出现 OOM 异常。

4. 如何定义线程池参数
- CPU 密集型 => 线程池的大小推荐为 CPU 数量 + 1， CPU 数量可以根据 Runtime.availableProcessors 方法获取
- IO 密集型 => CPU 数量 * CPU 利用率 * (1 + 线程等待时间/线程 CPU 时间)
- 混合型 => 将任务分为 CPU 密集型和 IO 密集型，然后分别使用不同的线程池去处理，从而使每个线程池可以根据各自的工作负载来调整
- 阻塞队列 => 推荐使用有界队列，有界队列有助于避免资源耗尽的情况发生
- 拒绝策略 => 默认采用的是 AbortPolicy 拒绝策略，直接在程序中抛出 RejectedExecutionException 异常（因为是运行时异常，不强制 catch），这种处理方式不够优雅。处理拒绝策略有以下几种比较推荐：
  - 在程序中捕获 RejectedExecutionException 异常，在捕获异常中对任务进行处理。针对默认拒绝策略
  - 使用 CallerRunsPolicy 拒绝策略，该策略会将任务交给调用 execute 的线程执行（一般为主线程），此时主线程将在一段时间内不能提交任何任务，从而使工作线程处理正在执行的任务。此时提交的线程将被保存在 TCP 队列中，TCP 队列满将会影响客户端，这是一种平缓的性能降低
  - 自定义拒绝策略，只需要实现 RejectedExecutionHandler 接口即可
  - 如果任务不是特别重要，使用 DiscardPolicy 和 DiscardOldestPolicy 拒绝策略将任务丢弃也是可以的
四、调度池
```
public ScheduledThreadPoolExecutor(int corePoolSize) {
    super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
          new DelayedWorkQueue());
}
```
- corePoolSize => 自定义
- maximumPoolSize => Integer.MAX_VALUE
- keepAliveTime => 0
- workQueue => DelayedWorkQueue
方法：
- schedule(Callable<V> callable, long delay, TimeUnit unit) 创建并执行并销毁一个 callable 在延迟指定 delay 时间后
- 同上，callable 换成了 runnable
- scheduleAtFixedRate(Runnable command, long initialDelay, long period, TimeUnit unit) 创建并执行并结束一个 runnable 在延迟指定 initialDelay 时间，然后每隔 initialDelay + period * n 时间执行一次
- scheduleWithFixedDelay(Runnable command, long initialDelay, long delay, TimeUnit unit) 创建并执行并结束一个 runnable 在延迟指定 initialDelay 时间，然后第一次执行完成后，间隔 delay 时间继续执行一次，无限循环。
程序示例：
```
public class N06_Executor {

    public static void main(String[] args) {
        ScheduledExecutorService executorService = Executors.newScheduledThreadPool(3);

        // 延迟 3s，每隔1s执行一次
        executorService.scheduleAtFixedRate(() -> System.out.println("hello world"), 3, 1, TimeUnit.SECONDS);

        // 延迟 3s 执行
//        executorService.schedule(() -> System.out.println("hello world"), 3, TimeUnit.SECONDS);
//        executorService.shutdown();
    }
}
```
参考：
- 为什么阿里巴巴要禁用Executors创建线程池？
- Java多线程与高并发(五):线程池
- 《Java并发编程的艺术》
相关阅读:
11月28日总结
 12月06日总结
 12月02日总结
 11月26日总结
 12月05日总结
 11月30日总结
 软件设计职责链模式
 软件设计策略模式
 软件设计组合模式
 大数据竞赛练习题二
原文地址：https://www.cnblogs.com/cloudflow/p/13894328.html

Java并发编程05-线程池

一、为什么要使用线程池

二、Executors 创建线程池的方式

三、ThreadPoolExecutor 对象

1. 构造函数与参数意义

2. 线程池执行任务逻辑和线程池参数的关系

3. Executors 创建返回 ThreadPoolExecutor 对象

4. 如何定义线程池参数

四、调度池