Parallel LINQ
1 System.Linq.ParallelEnumerable
重要方法概览:
1)public static ParallelQuery<TSource> AsParallel<TSource>(this IEnumerable<TSource> source);启用查询的并行化
2)public static ParallelQuery<TSource> AsOrdered<TSource>(this ParallelQuery<TSource> source);启用将数据源视为“已经排序”的处理方法,重写默认的将数据源视为“未经排序”的处理方法。只可以对由 AsParallel、ParallelEnumerable.Range和 ParallelEnumerable.Repeat 返回的泛型序列调用 AsOrdered。
3) public static ParallelQuery<TSource> WithExecutionMode<TSource>(this ParallelQuery<TSource> source, ParallelExecutionMode executionMode);设置查询的执行模式
4)public static double Average(this ParallelQuery<double> source);计算序列平均值
5) public static decimal? Max(this ParallelQuery<decimal?> source);计算序列最大值
6) public static decimal? Min(this ParallelQuery<decimal?> source);计算序列中最小值
7)public static decimal? Sum(this ParallelQuery<decimal?> source);求和
8)public static TResult Aggregate<TSource, TAccumulate, TResult>(this ParallelQuery<TSource> source, TAccumulate seed, Func<TAccumulate, TSource, TAccumulate> func, Func<TAccumulate, TResult> resultSelector);对一个序列并行应用累加器函数。 将指定的种子值用作累加器的初始值,并使用指定的函数选择结果值。
9)public static ParallelQuery<TSource> WithCancellation<TSource>(this ParallelQuery<TSource> source, CancellationToken cancellationToken);设置要与查询关联的 System.Threading.CancellationToken。
10)public static ParallelQuery<TSource> WithDegreeOfParallelism<TSource>(this ParallelQuery<TSource> source, int degreeOfParallelism);设置要在查询中使用的并行度。
11)public static void ForAll<TSource>(this ParallelQuery<TSource> source, Action<TSource> action);对 source 中的每个元素并行调用指定的操作。
12)public static ParallelQuery<TSource> WithMergeOptions<TSource>(this ParallelQuery<TSource> source, ParallelMergeOptions mergeOptions);设置此查询的合并选项,它指定查询对输出进行缓冲处理的方式。
说明:
1)PLINQ实现了全部的LINQ操作符,并添加了部分并行操作符。
2)不论是并发集合或传统集合都可使用PLINQ。
3)默认情况下,执行PLINQ时,.NET尽量避免高开销并行化算法;若想强制并行执行,可使用ParallelExecutionMode.ForceParallelism。
4)根据可用内核数,PLINQ将接受的数据源分解为多份,然后在不同的内核上处理每一份。且对每一份的执行没有固定顺序。
5)PLINQ查询有延缓执行的效果,因此要捕获查询所产生的结果在被消费者消费时产生的异常。
6)Aggregate的重载方法之一可以将数据源序列分区成几个子序列(分区)。 对分区内的每个元素执行 updateAccumulatorFunc,得到每个分区的单个累积结果。 然后,在每个分区的结果上调用 combineAccumulatorsFunc 来产生一个元素。 最后,combineAccumulatorsFunc 产生的元素通过 resultSelector 函数进行转换即可获得最终结果。
2 使用示例
定义List<T> list = ......,代码中的condition为筛选条件。
1)排序
1 //确保运算获得的数据输出顺序与原集合一致 2 var resLinq1 = from item in list.AsParallel().AsOrdered() 3 where (condition) 4 select item; 5 var res1 = list.AsParallel().AsOrdered().Where(m=>m>4); 6 //按升序排列使用ascending,降序排列使用descending 7 var resLinq2 = from item in list.AsParallel() 8 where (condition) 9 orderby item descending 10 select item; 11 12 //升序排列使用OrderBy,降序排列使用OrderByDescending 13 var res2 = list.AsParallel().Where(item =>condition).OrderByDescending(m => m);
2)设置查询的执行模式
1 //强制并行化整个查询 2 var resLinq3 = from item in list.AsParallel(). 3 WithExecutionMode(ParallelExecutionMode.ForceParallelism) 4 where (condition) 5 orderby item descending 6 select item; 7 8 var res3 = list.AsParallel(). 9 WithExecutionMode(ParallelExecutionMode.ForceParallelism). 10 Where(condition).OrderByDescending(m => m);
3)规约操作
假定这里的list中的元素为数字。
1 var resLinq4 = (from item in list.AsParallel() 2 where (condition) 3 select item).Average(); 4 var res4 = list.AsParallel().Where(item => condition).Average(); 5 6 var resLinq5 = (from item in list.AsParallel() 7 where (condition) 8 select item).Max(); 9 var res5 = list.AsParallel().Where(item => condition).Max();
4)自定义聚集函数
假定这里的list中的元素为数字。
1 //方差计算公式:S2 = ((X1-A)2+(X2-A)2+...+(Xn-A)2)/N,其中A为平均值,N为序列中元素个数,Xi为序列中第i个元素 2 //sum 求和部分结果,item:集合list中的元素,result:经计算后得到的方差值。 3 var average = list.AsParallel().Average(); 4 var res6 = list.AsParallel().Aggregate( 5 0d, 6 (sum, item) => sum + Math.Pow((item - average),2), 7 (result)=>result/list.Count 8 ); 9 //与上面结果相同,只不过多了combineAccumulatorsFunc函数 10 var res7 = list.AsParallel().Aggregate( 11 0d, 12 (sum, item) => sum + Math.Pow((item - average), 2), 13 (total,thisTask)=>total+thisTask, 14 (result) => result / list.Count
5)取消并行操作
1 CancellationTokenSource cts = new CancellationTokenSource(); 2 CancellationToken ct = cts.Token; 3 CancelParallel(ct,list); 4 5 private static void CancelParallel(CancellationToken ct,List<int> list) 6 { 7 //conditionExec此条件为真时才取消并行操作 8 if (conditionExec) 9 { 10 ct.ThrowIfCancellationRequested(); 11 } 12 var average = list.AsParallel().Average(); 13 list.AsParallel().WithCancellation(ct).Aggregate( 14 0d, 15 (sum, item) => sum + Math.Pow((item - average), 2), 16 (total, thisTask) => total + thisTask, 17 (result) => result / list.Count 18 ); 19 }
6)指定并行度
1 int maxDegreeOfParallelism = Environment.ProcessorCount; 2 var res8 = list.AsParallel().WithDegreeOfParallelism(maxDegreeOfParallelism).Aggregate( 3 0d, 4 (sum, item) => sum + Math.Pow((item - average), 2), 5 (result) => result / list.Count 6 );
7)使用ForAll
1 ConcurrentBag<T> bag = new ConcurrentBag<T>(); 2 list.AsParallel().ForAll(item => 3 { 4 //对元素处理后加如集合 5 bag.Add(itemAfter); 6 });
8)异常处理
使用AggregateException处理异常,具体示例见Tasks.Parallel部分。
线程池
1 CLR 4线程池引擎与线程
- CLR线程池引擎管理着一个池的线程,这些线程可以处理工作项。线程池引擎会每隔一段时间创建出额外的空闲线程,这些空闲线程以FIFO的顺序将工作项从队列中取出,并且开始执行这些工作项。
- CLR线程池引擎创建一个托管线程需要数千CPU周期,并且消耗内存。
- CLR线程池引擎维护了最低数量的闲置工作线程,通常等于逻辑内核数。
- CLR线程池引擎管理的都是后台线程,即所有前台线程都退出了,后台线程不会维持应用程序继续运行。
2 全局队列与局部队列
- 使用使用TPL创建任务时,一个新的工作项会被加入到线程池全局队列中,当线程池中所有可用的工作线程都在执行工作项时,新加入线程池全局队列的工作相必须等待,直到有可用的工作项。
- 线程池中每一个分配给了任务的线程都有自己的局部队列,这样可以减少对全局队列的争用。局部对列通常以LIFO的顺序抽取任务并执行。
3 Threading.ThreadPool
与使用任务将工作项加入队列相比,创建Task实例有一定的开销,但可以利用一些取消标记等。
//使用QueueUserWorkItem方法将任务加入队列中。
ThreadPool.QueueUserWorkItem((state) => { //具体业务 });
//workerThreads线程池中辅助线程的最大数目,completionPortThreads线程池中异步 I/O 线程的最大数目
ThreadPool.GetMaxThreads(out workerThreads, out completionPortThreads);
//workerThreads线程池根据需要创建的最少数量的辅助线程
//completionPortThreads线程池根据需要创建的最少数量的异步 I/O 线程
ThreadPool.GetMinThreads(out workerThreads, out completionPortThreads);
-----------------------------------------------------------------------------------------
转载与引用请注明出处。
时间仓促,水平有限,如有不当之处,欢迎指正。