“本文为传智大数据课程视频资料视频整理汇总”
- 线程池
- 消息队列
线程池
实现线程池的5种方式
1、 Single Thread Executor : 只有一个线程的线程池,因此所有提交的任务是顺序执行,
代码: Executors.newSingleThreadExecutor()
2、 Cached Thread Pool : 线程池里有很多线程需要同时执行,老的可用线程将被新的任务触发重新执行,如果线程超过60秒内没执行,那么将被终止并从池中删除,
代码:Executors.newCachedThreadPool()
3、 Fixed Thread Pool : 拥有固定线程数的线程池,如果没有任务执行,那么线程会一直等待,
代码: Executors.newFixedThreadPool(4)
在构造函数中的参数4是线程池的大小,你可以随意设置,也可以和cpu的核数量保持一致,获取cpu的核数量int cpuNums = Runtime.getRuntime().availableProcessors();
4、 Scheduled Thread Pool : 用来调度即将执行的任务的线程池,可能是不是直接执行, 每隔多久执行一次... 策略型的
代码:Executors.newScheduledThreadPool()
5、 Single Thread Scheduled Pool : 只有一个线程,用来调度任务在指定时间执行
代码:Executors.newSingleThreadScheduledExecutor()
线程池的使用
提交 Runnable ,任务完成后 Future 对象返回 null
调用excute或submit提交任务, 匿名Runable重写run方法, run方法里是业务逻辑
提交 Callable,该方法返回一个 Future 实例表示任务的状态
调用submit提交任务, 匿名Callable,重写call方法, 有返回值, 获取返回值会阻塞,一直要等到线程任务返回结果
线程池示例:
public class PoolTest { public static void main(String[] args) throws Exception { Future<?> submit = null; Random random = new Random(); //创建固定数量线程池 // ExecutorService exec = Executors.newFixedThreadPool(4); //创建调度线程池 ScheduledExecutorService exec = Executors.newScheduledThreadPool(4); //用来记录各线程的返回结果 ArrayList<Future<?>> results = new ArrayList<Future<?>>(); for (int i = 0; i < 10; i++) { //fixedPool提交线程,runnable无返回值,callable有返回值 submit = exec.submit(new TaskRunnable(i)); /*submit = exec.submit(new TaskCallable(i));*/ //对于schedulerPool来说,调用submit提交任务时,跟普通pool效果一致 // submit = exec.submit(new TaskCallable(i)); //对于schedulerPool来说,调用schedule提交任务时,则可按延迟,按间隔时长来调度线程的运行 // submit = exec.schedule(new TaskCallable(i), random.nextInt(10), TimeUnit.SECONDS); //存储线程执行结果 results.add(submit); } //打印结果 for(Future f: results){ boolean done = f.isDone(); System.out.println(done?"已完成":"未完成"); //从结果的打印顺序可以看到,即使未完成,也会阻塞等待 System.out.println("线程返回future结果: " + f.get()); } exec.shutdown(); } } // class TaskCallable implements Callable<String> { private int s; Random r = new Random(); public TaskCallable(int s){ this.s = s; } @Override public String call() throws Exception { String name = Thread.currentThread().getName(); long currentTimeMillis = System.currentTimeMillis(); System.out.println(name+" 启动时间:" + currentTimeMillis/1000); int rint = r.nextInt(3); try { Thread.sleep(rint*1000); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println(name + " is working..."+s); return s+""; } } class TaskRunnable implements Runnable{ private int s; public TaskRunnable(int s){ this.s = s; } Random r = new Random(); @Override public void run() { String name = Thread.currentThread().getName(); long currentTimeMillis = System.currentTimeMillis(); System.out.println(name+" 启动时间:" + currentTimeMillis/1000); int rint = r.nextInt(3); try { Thread.sleep(rint*1000); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println(name + " is working..."+s); } }
消息队列
BlockingQueue也是java.util.concurrent下的主要用来控制线程同步的工具。
主要的方法是:put、take一对阻塞存取;add、poll一对非阻塞存取。
插入:
1)add(anObject):把anObject加到BlockingQueue里,即如果BlockingQueue可以容纳,则返回true,否则抛出异常,不好
2)offer(anObject):表示如果可能的话,将anObject加到BlockingQueue里,即如果BlockingQueue可以容纳,则返回true,否则返回false.
3)put(anObject):把anObject加到BlockingQueue里,如果BlockQueue没有空间,则调用此方法的线程被阻断直到BlockingQueue里面有空间再继续, 有阻塞, 放不进去就等待
读取:
4)poll(time):取走BlockingQueue里排在首位的对象,若不能立即取出,则可以等time参数规定的时间,取不到时返回null; 取不到返回null
5)take():取走BlockingQueue里排在首位的对象,若BlockingQueue为空,阻断进入等待状态直到Blocking有新的对象被加入为止; 阻塞, 取不到就一直等
其他
int remainingCapacity();返回队列剩余的容量,在队列插入和获取的时候,不要瞎搞,数 据可能不准, 不能保证数据的准确性
boolean remove(Object o); 从队列移除元素,如果存在,即移除一个或者更多,队列改 变了返回true
public boolean contains(Object o); 查看队列是否存在这个元素,存在返回true
int drainTo(Collection<? super E> c); //移除此队列中所有可用的元素,并将它们添加到给定 collection 中。取出放到集合中
int drainTo(Collection<? super E> c, int maxElements); 和上面方法的区别在于,指定了移 动的数量; 取出指定个数放到集合
BlockingQueue有四个具体的实现类,常用的两种实现类为:
1、ArrayBlockingQueue:一个由数组支持的有界阻塞队列,规定大小的BlockingQueue,其构造函数必须带一个int参数来指明其大小.其所含的对象是以FIFO(先入先出)顺序排序的。
2、LinkedBlockingQueue:大小不定的BlockingQueue,若其构造函数带一个规定大小的参数,生成的BlockingQueue有大小限制,若不带大小参数,所生成的BlockingQueue的大小由Integer.MAX_VALUE来决定.其所含的对象是以FIFO(先入先出)顺序排序的。
LinkedBlockingQueue 可以指定容量,也可以不指定,不指定的话,默认最大是Integer.MAX_VALUE,其中主要用到put和take方法,put方法在队列满的时候会阻塞直到有队列成员被消费,take方法在队列空的时候会阻塞,直到有队列成员被放进来。
LinkedBlockingQueue和ArrayBlockingQueue区别:
LinkedBlockingQueue和ArrayBlockingQueue比较起来,它们背后所用的数据结构不一样,导致LinkedBlockingQueue的数据吞吐量要大于ArrayBlockingQueue,但在线程数量很大时其性能的可预见性低于ArrayBlockingQueue.
生产者消费者的示例代码:
1 public class SimpleTest { 2 3 4 public static void main(String[] args) { 5 BlockingQueue<String> queue = new LinkedBlockingQueue<String>(2); 6 // BlockingQueue<String> queue = new LinkedBlockingQueue<String>(); 7 // 不设置的话,LinkedBlockingQueue默认大小为Integer.MAX_VALUE 8 // BlockingQueue<String> queue = new ArrayBlockingQueue<String>(2); 9 Consumer consumer = new Consumer(queue); 10 Producer producer = new Producer(queue); 11 for (int i = 0; i < 3; i++) { 12 new Thread(producer, "ProducerA" + (i + 1)).start(); 13 } 14 for (int i = 0; i < 4; i++) { 15 new Thread(consumer, "ConsumerA" + (i + 1)).start(); 16 } 17 18 new Thread(producer, "ProducerB" + (5)).start(); 19 } 20 } 21 22 class Producer implements Runnable { 23 24 private BlockingQueue<String> queue; 25 26 public Producer(BlockingQueue<String> queue) { 27 this.queue = queue; 28 } 29 30 @Override 31 public void run() { 32 try { 33 34 System.out.println("I have made a product:" 35 + Thread.currentThread().getName()); 36 String temp = Thread.currentThread().getName(); 37 queue.put(temp);//如果队列是满的话,会阻塞当前线程 38 } catch (InterruptedException e) { 39 e.printStackTrace(); 40 } 41 } 42 } 43 44 class Consumer implements Runnable{ 45 46 private BlockingQueue<String> queue; 47 48 public Consumer(BlockingQueue<String> queue){ 49 this.queue = queue; 50 } 51 @Override 52 public void run() { 53 try { 54 String consumer = Thread.currentThread().getName(); 55 // System.out.println(consumer+" 准备获取商品"); 56 String temp = queue.take();//如果队列为空,会阻塞当前线程 57 System.out.println(consumer+" 获得了"+temp); 58 } catch (InterruptedException e) { 59 e.printStackTrace(); 60 } 61 } 62 }
java并发编程的一些总结
1 不应用线程池的缺点
有些开发者图省事,遇到需要多线程处理的地方,直接new Thread(...).start(),对于一般场景是没问题的,但如果是在并发请求很高的情况下,就会有些隐患:
-
- 新建线程的开销。线程虽然比进程要轻量许多,但对于JVM来说,新建一个线程的代价还是挺大的,决不同于新建一个对象
- 资源消耗量。没有一个池来限制线程的数量,会导致线程的数量直接取决于应用的并发量,这样有潜在的线程数据巨大的可能,那么资源消耗量将是巨大的
- 稳定性。当线程数量超过系统资源所能承受的程度,稳定性就会成问题
2 制定执行策略
在每个需要多线程处理的地方,不管并发量有多大,需要考虑线程的执行策略
-
- 任务以什么顺序执行
- 可以有多少个任务并发执行
- 可以有多少个任务进入等待执行队列
- 系统过载的时候,应该放弃哪些任务?如何通知到应用程序?
- 一个任务的执行前后应该做什么处理
3线程池的类型
不管是通过Executors创建线程池,还是通过Spring来管理,都得清楚知道有哪几种线程池:
-
- FixedThreadPool:定长线程池,提交任务时创建线程,直到池的最大容量,如果有线程非预期结束,会补充新线程
- CachedThreadPool:可变线程池,它犹如一个弹簧,如果没有任务需求时,它回收空闲线程,如果需求增加,则按需增加线程,不对池的大小做限制
- SingleThreadExecutor:单线程。处理不过来的任务会进入FIFO队列等待执行
- SecheduledThreadPool:周期性线程池。支持执行周期性线程任务
其实,这些不同类型的线程池都是通过构建一个ThreadPoolExecutor来完成的,所不同的是corePoolSize,maximumPoolSize,keepAliveTime,unit,workQueue,threadFactory这么几个参数。具体可以参见JDK DOC。
4 线程池饱和策略
由以上线程池类型可知,除了CachedThreadPool其他线程池都有饱和的可能,当饱和以后就需要相应的策略处理请求线程的任务,比如,达到上限时通过ThreadPoolExecutor.setRejectedExecutionHandler方法设置一个拒绝任务的策略,JDK提供了AbortPolicy、CallerRunsPolicy、DiscardPolicy、DiscardOldestPolicy几种策略,具体差异可见JDK DOC
5 线程无依赖性
多线程任务设计上尽量使得各任务是独立无依赖的,所谓依赖性可两个方面:
-
- 线程之间的依赖性。如果线程有依赖可能会造成死锁或饥饿
- 调用者与线程的依赖性。调用者得监视线程的完成情况,影响可并发量
当然,在有些业务里确实需要一定的依赖性,比如调用者需要得到线程完成后结果,传统的Thread是不便完成的,因为run方法无返回值,只能通过一些共享的变量来传递结果,但在Executor框架里可以通过Future和Callable实现需要有返回值的任务,当然线程的异步性导致需要有相应机制来保证调用者能等待任务完成,关于Future和Callable的用法前文已讲解;