• Java并发专题 带返回结果的批量任务执行 CompletionService ExecutorService.invokeAll


    转载请标明出处:http://blog.csdn.net/lmj623565791/article/details/27250059

    一般情况下,我们使用Runnable作为基本的任务表示形式,但是Runnable是一种有很大局限的抽象,run方法中只能记录日志,打印,或者把数据汇总入某个容器(一方面内存消耗大,另一方面需要控制同步,效率很大的限制),总之不能返回执行的结果;比如同时1000个任务去网络上抓取数据,然后将抓取到的数据进行处理(处理方式不定),我觉得最好的方式就是提供回调接口,把处理的方式最为回调传进去;但是现在我们有了更好的方式实现:CompletionService + Callable

    Callable的call方法可以返回执行的结果;

    CompletionService将Executor(线程池)和BlockingQueue(阻塞队列)结合在一起,同时使用Callable作为任务的基本单元,整个过程就是生产者不断把Callable任务放入阻塞对了,Executor作为消费者不断把任务取出来执行,并返回结果;

    优势:

    a、阻塞队列防止了内存中排队等待的任务过多,造成内存溢出(毕竟一般生产者速度比较快,比如爬虫准备好网址和规则,就去执行了,执行起来(消费者)还是比较慢的)

    b、CompletionService可以实现,哪个任务先执行完成就返回,而不是按顺序返回,这样可以极大的提升效率;

    1、CompletionService : Executor + BlockingQueue 

    下面看个例子:

    package com.zhy.concurrency.completionService;
    
    import java.util.Random;
    import java.util.concurrent.BlockingQueue;
    import java.util.concurrent.Callable;
    import java.util.concurrent.CompletionService;
    import java.util.concurrent.ExecutionException;
    import java.util.concurrent.ExecutorCompletionService;
    import java.util.concurrent.ExecutorService;
    import java.util.concurrent.Executors;
    import java.util.concurrent.Future;
    import java.util.concurrent.LinkedBlockingDeque;
    
    /**
     * 将Executor和BlockingQueue功能融合在一起,可以将Callable的任务提交给它来执行, 然后使用take()方法获得已经完成的结果
     * 
     * @author zhy
     * 
     */
    public class CompletionServiceDemo
    {
    
    	public static void main(String[] args) throws InterruptedException,
    			ExecutionException
    	{
    		/**
    		 * 内部维护11个线程的线程池
    		 */
    		ExecutorService exec = Executors.newFixedThreadPool(11);
    		/**
    		 * 容量为10的阻塞队列
    		 */
    		final BlockingQueue<Future<Integer>> queue = new LinkedBlockingDeque<Future<Integer>>(
    				10);
    		//实例化CompletionService
    		final CompletionService<Integer> completionService = new ExecutorCompletionService<Integer>(
    				exec, queue);
    
    		/**
    		 * 模拟瞬间产生10个任务,且每个任务执行时间不一致
    		 */
    		for (int i = 0; i < 10; i++)
    		{
    			completionService.submit(new Callable<Integer>()
    			{
    				@Override
    				public Integer call() throws Exception
    				{
    					int ran = new Random().nextInt(1000);
    					Thread.sleep(ran);
    					System.out.println(Thread.currentThread().getName()
    							+ " 休息了 " + ran);
    					return ran;
    				}
    			});
    		}
    		
    		/**
    		 * 立即输出结果
    		 */
    		for (int i = 0; i < 10; i++)
    		{
    			try
    			{	
    				//谁最先执行完成,直接返回
    				Future<Integer> f = completionService.take();
    				System.out.println(f.get());
    			} catch (InterruptedException e)
    			{
    				e.printStackTrace();
    			} catch (ExecutionException e)
    			{
    				e.printStackTrace();
    			}
    		}
    
    		exec.shutdown();
    
    	}
    
    }
    
    输出结果:

    pool-1-thread-4 休息了 52
    52
    pool-1-thread-1 休息了 59
    59
    pool-1-thread-10 休息了 215
    215
    pool-1-thread-9 休息了 352
    352
    pool-1-thread-5 休息了 389
    389
    pool-1-thread-3 休息了 589
    589
    pool-1-thread-2 休息了 794
    794
    pool-1-thread-7 休息了 805
    805
    pool-1-thread-6 休息了 909
    909
    pool-1-thread-8 休息了 987
    987
    

    最先执行完成的直接返回,并不需要按任务提交的顺序执行,如果需要写个高并发的程序,且每个任务需要返回执行结果,这是个相当不错的选择!


    2、ExecutorService.invokeAll

    ExecutorService的invokeAll方法也能批量执行任务,并批量返回结果,但是呢,有个我觉得很致命的缺点,必须等待所有的任务执行完成后统一返回,一方面内存持有的时间长;另一方面响应性也有一定的影响,毕竟大家都喜欢看看刷刷的执行结果输出,而不是苦苦的等待;

    下面看个例子:

    package com.zhy.concurrency.executors;
    
    import java.util.ArrayList;
    import java.util.List;
    import java.util.Random;
    import java.util.concurrent.Callable;
    import java.util.concurrent.ExecutionException;
    import java.util.concurrent.ExecutorService;
    import java.util.concurrent.Executors;
    import java.util.concurrent.Future;
    
    public class TestInvokeAll
    {
    
    	public static void main(String[] args) throws InterruptedException,
    			ExecutionException
    	{
    		ExecutorService exec = Executors.newFixedThreadPool(10);
    
    		List<Callable<Integer>> tasks = new ArrayList<Callable<Integer>>();
    		Callable<Integer> task = null;
    		for (int i = 0; i < 10; i++)
    		{
    			task = new Callable<Integer>()
    			{
    				@Override
    				public Integer call() throws Exception
    				{
    					int ran = new Random().nextInt(1000);
    					Thread.sleep(ran);
    					System.out.println(Thread.currentThread().getName()+" 休息了 " + ran );
    					return ran;
    				}
    			};
    
    			tasks.add(task);
    		}
    		
    		long s = System.currentTimeMillis();
    		
    		
    		List<Future<Integer>> results = exec.invokeAll(tasks);
    		
    		System.out.println("执行任务消耗了 :" + (System.currentTimeMillis() - s) +"毫秒");
    		
    		for (int i = 0; i < results.size(); i++)
    		{
    			try
    			{
    				System.out.println(results.get(i).get());
    			} catch (Exception e)
    			{
    				e.printStackTrace();
    			}
    		}
    
    		
    		exec.shutdown();
    
    	}
    
    }
    

    执行结果:

    pool-1-thread-10 休息了 1
    pool-1-thread-5 休息了 59
    pool-1-thread-6 休息了 128
    pool-1-thread-1 休息了 146
    pool-1-thread-3 休息了 158
    pool-1-thread-7 休息了 387
    pool-1-thread-9 休息了 486
    pool-1-thread-8 休息了 606
    pool-1-thread-4 休息了 707
    pool-1-thread-2 休息了 817
    执行任务消耗了 :819毫秒
    146
    817
    158
    707
    59
    128
    387
    606
    486
    1
    

    我特意在任务提交完成打印了一个时间,然后invokeAll执行完成后打印了下时间,可以看出invokeAll返回是等待所有线程执行完毕的。这点来说,我觉得可用性不如CompletionService。


    嗯,对于批量执行任务,且携带返回结果的案例就到这里~如果有疑问或者代码中存在错误请指出~




    版权声明:本文为博主原创文章,未经博主允许不得转载。

  • 相关阅读:
    re模块详解
    PythonS12-day4学习笔记
    Python-day3作业-haproxy配置文件管理脚本
    Python——Day3知识点——文件操作
    Python-Day3知识点——深浅拷贝、函数基本定义、内置函数
    collections系列
    set集合
    服务器三大体系SMP、NUMA、MPP介绍
    CPU指令集
    PS与TOP详解
  • 原文地址:https://www.cnblogs.com/dingxiaoyue/p/4924945.html
Copyright © 2020-2023  润新知