• 多线程(3) — 线程池


      线程的创建和销毁是消耗时间和资源的,创建大量的线程会抢占宝贵的内存资源,大量的线程回收也给GC带来很大的压力。为了避免这种情况的出现,可以让创建的线程复用,那么线程池就应用而生了。需要线程时,从线程池中拿一个线程,不需要时再归还给线程池,从而达到了复用线程的效果。

      JDK提供了一套Executor框架,用于进行线程控制,本质是一个线程池。ThreadPoolExecutor表示一个线程池,Executors扮演着线程池工厂的角色,通过Executors可以取得一个拥有特定功能的线程池。主要有以下工厂方法:

        (1)public static ExecutorService newFixedThreadPool(int nThreads)

    返回一个固定线程数量的线程池,该池中的线程数量不变。当有新的任务提交时,线程池中要是有 空线程,任务会立即执行。若没有,则新的任务会被暂存在一个队列里,直到有空闲的线程再处理。

        (2)public static ExecutorService newSingleThreadExecutor()

    该方法返回一个只有一个线程的线程池。如果多于一个任务被提交到此线程池,任务会被保存在一个任务队列中,待线程空闲,按照先入先出的顺序执行队列中任务。

        (3)public static ExecutorService newCachedThreadPool()

    返回一个可根据实际情况调整线程数量的线程池。也就是线程池中线程的数量不是确定的,单有空闲线程可以复用,会优先使用可复用的线程。如果所有的线程都在工作,这时又有新的线程提交任务,则会创建新的线程来处理任务,所有线程在当前任务执行完毕后返回线程池,再进行复用。

        (4)public static ScheduledExecutorService newSingleThreadScheduledExecutor()

    返回一个ScheduledExecutorService 对象,线程池大小为1。ScheduledExecutorService 接口在ExecutorService 接口之上扩展了在给定时间执行某任务的功能。例如在某个固定时间延时执行或者周期性执行某个任务。

        (5)public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize)

    返回ScheduledExecutorService 对象,但该线程可以指定线程数量大小

      以上核心线程池的内部实现,其实都是使用ThreadPoolExecutor类进行的封装。这个类很强大,能实现多种线程池,现在先看看这个类的构造方法:

    public ThreadPoolExecutor(int corePoolSize,
                                  int maximumPoolSize,
                                  long keepAliveTime,
                                  TimeUnit unit,
                                  BlockingQueue<Runnable> workQueue,
                                  ThreadFactory threadFactory,
                                  RejectedExecutionHandler handler) {
            if (corePoolSize < 0 ||
                maximumPoolSize <= 0 ||
                maximumPoolSize < corePoolSize ||
                keepAliveTime < 0)
                throw new IllegalArgumentException();
            if (workQueue == null || threadFactory == null || handler == null)
                throw new NullPointerException();
            this.corePoolSize = corePoolSize;
            this.maximumPoolSize = maximumPoolSize;
            this.workQueue = workQueue;
            this.keepAliveTime = unit.toNanos(keepAliveTime);
            this.threadFactory = threadFactory;
            this.handler = handler;
        }

      下面来说说这几个参数的含义:

        (1)corePoolSize:指定了线程池中的线程数量

        (2)maximumPoolSize:指定了线程池中最大线程的数量

        (3)keepAliveTime:当线程池中线程的数量超过corePoolSize时,多语的空闲线程的存活时间,即超过corePoolSize的空闲线程,在多长时间被销毁。

        (4)unit:keepAliveTime的单位

        (5)workQueue:任务队列,被提交的但还没有执行的任务

        (6)threadFactory:线程工厂,用于创建线程,一般用默认的就可以了

        (7)handler:拒绝策略,当任务太多,来不及处理时,如何拒绝任务。

      以上几个参数重点说说workQueue和handler

      workQueue:指被提交但未执行的任务队列,是BlockingQueue接口对象,仅用于存放Runnable对象,在ThreadPoolExecutor构造函数中可以是以下几种BlockingQueue接口

    (1)直接提交的队列:SynchronizeQueue。这个队列没有容量,每个插入都要等待一个删除,提交的任务不会被真实保存,将任务直接交给新线程执行,如果没有空闲线程,会尝试创建新的进程,如果进程数量达到最大值,会执行拒绝策略,一般需要很大的maximumPoolSize。

    (2)有界的任务队列:ArrayBlockingQueue。构造函数必须带一个容量参数,表示该队列的最大容量。当新任务需要执行时,如果线程池中实际线程数小于corePoolSize,则会优先创建新线程,大于corePoolSize的话,会把任务加入等待队列。如果队列已满,无法加入,则在总线程数不大于maximumPoolSize前提下,创建新的进程执行任务,若大于maximumPoolSize,则执行拒绝策略。执行任务的顺序是先进先出。

    (3)无界的任务队列:LinkedBlockingQueue。除非系统资源耗尽,否则该队列不存在任务入队失败的情况。有新任务到来时,系统的线程数小于corePoolSize时,线程池会生成新的线程执行任务,达到corePoolSize后线程就不再增加了。若后续有任务提交,又没有空闲线程,那么直接加入队列等待,如果任务的创建和处理的速度差异很大的话,该队列会迅速增长,直到耗尽系统内存。执行任务的顺序是先进先出。

    (4)优先任务队列:PriorityBlockingQueue,带有优先级的任务队列,可以控制执行任务的先后顺序,是一个特殊的无界队列。根据任务自身携带的优先级顺序先后执行任务,确保系统性能同时可以保证质量。

      ThreadPoolExecutor 类核心调度代码如下,这段代码体现了线程池的工作逻辑。

    public void execute(Runnable command) {
            if (command == null)
                throw new NullPointerException();
            int c = ctl.get();
            if (workerCountOf(c) < corePoolSize) {
                if (addWorker(command, true))
                    return;
                c = ctl.get();
            }
            if (isRunning(c) && workQueue.offer(command)) {
                int recheck = ctl.get();
                if (! isRunning(recheck) && remove(command))
                    reject(command);
                else if (workerCountOf(recheck) == 0)
                    addWorker(null, false);
            }
            else if (!addWorker(command, false))
                reject(command);
        }

      代码逻辑:workerCountOf()函数取得了当前线程池的线程总数,小于corePoolSize时,会将任务通过addWorker()方法直接调度执行,否则在workQueue.offer()进入等待队列。如果进入等待队列失败(比如有界队列达到上限了,或SynchronousQueue),会执行addWorker(command, false),如果当前线程数达到了maximumPoolSize,则提交失败,执行拒绝策略。

      拒绝策略handler:线程池中线程已全部在执行任务,任务队列也满了放不下新任务,这个时候就需要一套机制来处理这个问题,就是拒绝策略。JDK提供了四种拒绝策略:

      • AbortPolicy策略:该策略会直接抛出异常,阻止系统正常工作。
      • CallerRunsPolicy策略:只要线程池未关闭,该策略直接在调用者线程中,运行当前被丢弃的任务。显然这样做不会真的丢弃任务,但是任务提交线程的性能会急剧下降。
      • DiscardOldsetPolicy策略:该策略将丢弃最大的一个请求,也就是即将被执行的一个任务,并尝试再次提交当前任务。
      • DiscardPolicy策略:该策略默默地丢弃无法处理的任务,不予任何处理。如果允许任务丢失,我觉得这应该是最好的方案了吧。

      以上策略均实现了RejectedExecutionHandler接口,若以上策略仍然无法满足实际应用的需要,可以自己扩展这个接口:

    public interface RejectedExecutionHandler {
        void rejectedExecution(Runnable r, ThreadPoolExecutor executor);
    }

      除了以上的任务队列和拒绝策略两个参数以外,还可以自定义线程创建,甚至可以扩展线程池。

      自定义线程创建:ThreadFactory,只有一个工厂方法。

    public interface ThreadFactory {
        Thread newThread(Runnable r);
    }

      当线程池需要线程时,就会调用这个方法。自定义线程可以跟踪线程池究竟何时创建了多少线程,也可以自定义线程的名称、组以及优先级等,甚至可以把线程设置为守护线程。

       扩展线程池:ThreadPoolExecutor是一个可以扩展的线程池,提供了beforeExecute()、afterExecute()、terminated()三个接口用来对线程池进行控制。

     下面来个自定义创建线程和扩展线程池的例子:

    /**
     * 扩展线程池
     *
     */
    public class ExtThreadPool {
        public static class MyTask implements Runnable{
            public String name;
            public MyTask(String name){
                this.name = name;
            }
            @Override
            public void run() {
                System.out.println("正在执行 Thread ID:"+Thread.currentThread().getId()+",Task name = "+this.name);
                try {
                    Thread.sleep(100);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            }
        }
        
        public static void main(String[] args) throws InterruptedException {
            ExecutorService es = new ThreadPoolExecutor(5,5,0L,TimeUnit.MILLISECONDS,
                    new LinkedBlockingQueue<Runnable>(),
                    new ThreadFactory(){
                        @Override
                        public Thread newThread(Runnable r) {
                            Thread t = new Thread(r);
                            t.setDaemon(true);
                            System.out.println("Create "+t);
                            return t;
                        }
            }){
    
                @Override
                protected void beforeExecute(Thread t, Runnable r) {
                    System.out.println("准备好了,开始执行:"+((MyTask) r).name);
                }
    
                @Override
                protected void afterExecute(Runnable r, Throwable t) {
                    System.out.println("执行完成了:"+((MyTask) r).name);
                }
    
                @Override
                protected void terminated() {
                    System.out.println("线程退出");
                }
                
            };
            
            for (int i = 0; i < 5; i++) {
                MyTask task = new MyTask("MyTask-"+i);
                es.execute(task);
                Thread.sleep(10);
            }
            es.shutdown();
        }
    }

    执行结果如下:

    Create Thread[Thread-0,5,main]
    准备好了,开始执行:MyTask-0
    正在执行 Thread ID:11,Task name = MyTask-0
    Create Thread[Thread-1,5,main]
    准备好了,开始执行:MyTask-1
    正在执行 Thread ID:12,Task name = MyTask-1
    Create Thread[Thread-2,5,main]
    准备好了,开始执行:MyTask-2
    正在执行 Thread ID:13,Task name = MyTask-2
    Create Thread[Thread-3,5,main]
    准备好了,开始执行:MyTask-3
    正在执行 Thread ID:14,Task name = MyTask-3
    Create Thread[Thread-4,5,main]
    准备好了,开始执行:MyTask-4
    正在执行 Thread ID:15,Task name = MyTask-4

      在自定义的线程里ThreadFactory.newThread()方法把新增加的线程都设置为守护线程,这样主线程退出后,所有的线程就退出了,强制性的没有让线程执行完毕。

      beforeExecute()、afterExecute()、terminate()方法被重写,分别记录了一个任务开始、结束和整个线程池的退出。execute()方法提交执行任务。提交完成后,调用shutdown()方法来关闭线程池,这是个很安全的方法,如果当前还有线程在执行,shutdown()方法不会立即暴力终止所有任务,会等待所有任务执行完毕后关闭线程池,并且这个线程池不能再接受其他新的任务了。这三个重写的方法特别有助于应用程序的调试及问题的诊断。

  • 相关阅读:
    浅谈TCP三次握手和四次挥手
    浅谈网络七层协议
    websocket实例
    浅谈websocket
    python的垃圾回收机制
    解释型语言和编译型语言的区别
    装饰器修复技术@wraps
    Django基础知识点
    项目再Windows上没有问题,但是在Linux上运行报错OSError: [Errno 8] Exec format error:
    在Centos 7 系统上部署flask 项目 pipenv+nginx+gunicorn
  • 原文地址:https://www.cnblogs.com/wangyongwen/p/11213002.html
Copyright © 2020-2023  润新知