• C#的变迁史


      在.NET 4.0中,并行计算与多线程得到了一定程度的加强,这主要体现在并行对象Parallel,多线程Task,与PLinq。这里对这些相关的特性一起总结一下。

      使用Thread方式的线程无疑是比较麻烦的,于是在这个版本中有了改善的版本Task。除了运行效率等方面的提升,Task还与并行计算紧紧联系在了一起,这些线程充分的利用了多核的优势,在一定的场合下,大幅的提高了程序的运行效率。屏蔽了运行细节的Task和Parallel方式使得程序员们完全不用编写任何针对多核的程序,只需要使用标准的类库完成任务就可以了,其它的CLR会去处理。

    这一篇中先看第一个利器:多线程Task。

      Task类为把线程类进行改良,使之使用起来更简便,更加容易。要想开启一个新的线程执行任务,只要调用Task.Factory.StartNew方法就可以了,执行完这个语句后线程就开始运行了。当然了,使用new初始化一个Task,然后适时调用其Start方法开始运行也是很不错的一个选择。

    using System;
    using System.Threading.Tasks;
    
    class Program
    {
        static void Main(string[] args)
        {    
            var task = Task.Factory.StartNew(() =>
            {
               for (int i = 0; i < 100; i++) { Console.Write('B'); }
            });
    
            task.ContinueWith(t =>
            {
                Console.WriteLine();
                Console.WriteLine("sub task {0} done", t.Id);
            });
    
            for (int i = 0; i < 100; i++) { Console.Write('A'); }
    
            task.Wait();
        }
    }

      注意最后的task.Wait(),调用这个方法是等待子线程执行结束,当需要等待子线程结果的时候,它最有用。

      task对象还有很多有用的方法,从它们的名字就可以知道它们各自的用途了,其中实例方法如上面的ContinueWith方法,它会在task执行完毕后执行其参数指定的行为;静态方法如WaitAny,WaitAll等,它们指定了在执行多个task时主线程的等待条件。

      对于多线程编程来说,启动线程并等待其自然结束是最常见的一种应用,处理也比较简单。相比而言,线程的中途终止和异常的处理要麻烦的多,难以预计的隐藏bug会出现在线程程序中。

    线程的终止类型

      线程执行的任务结束以后,线程就正常结束了。这里线程任务结束通常有3种情况:任务正常执行完,任务被取消,任务被异常打断结束。查询Task结束时的状态类型就是调用相关的属性,如下面的例子:

    static void Main(string[] args)
    {
        Task t = new Task(() =>
        {
           Console.WriteLine("任务开始工作……");
           //模拟工作过程
           Thread.Sleep(5000);
        });
        t.Start();
        t.ContinueWith((task) =>
        {
           Console.WriteLine("任务完成,完成时候的状态为:");
           Console.WriteLine("IsCanceled={0}	IsCompleted={1}	IsFaulted={2}", task.IsCanceled, task.IsCompleted, task.IsFaulted);
        });
        Console.ReadKey();
    }

      Task对象的三个属性IsCompleted,IsCanceled,IsFaulted就是查询线程的执行情况,不过需要注意,只要线程结束了,不管是以什么方式,IsCompleted始终返回true。IsCanceled代表程序被主动取消了,IsFaulted代表线程出现异常被动结束,这两个值都为false,代表线程是正常执行完结束的。

      正常结束的情况比较简单,这里就不多说了,这里看一下子线程任务的取消问题。这在编程中是很常见的一个需求,启动了一个线程以后,发现某些条件具备了,就不需要线程继续运行了,这个时候就需要取消线程任务。

    主动取消/中止线程的标准做法

      在以前的版本中,我基本上是都通Thread的Abort方法强行的中止线程。在C# 4.0中,标准的取消一个线程任务的做法是使用协作式取消(Cooperative Cancellation)。协作式取消的机制是,如果线程需要被停止,那么线程自身就得负责开放给调用者这样的接口:Cancled,然后线程在工作的同时,不断以某种频率检测Cancled标识(通常是把任务主体包装到循环中),若检测到Cancled,线程自己负责退出。

    下面是一个最基础的协作式取消的样例:

    // 设定取消标识
    CancellationTokenSource cts = new CancellationTokenSource();
    Thread t = new Thread(() =>
       {
           while (true)
           {
          // 检查取消标识
              if (cts.Token.IsCancellationRequested)
              {
                  Console.WriteLine("线程被终止!");
                  break;
              }
              Console.WriteLine(DateTime.Now.ToString());
              Thread.Sleep(1000);
            }
       });
    
    t.Start();
    Console.ReadLine();
    // 主线程申请取消
    cts.Cancel();

      调用者使用CancellationTokenSource的Cancle方法通知工作线程退出。工作线程则以一定的的频率一边工作,一边检查是否有外界传入进来的Cancel信号。若有这样的信号,则负责退出。可以看到,在正确停止线程的机制中,真正起到主要作用的是线程本身,它负责检测相关信号并退出。

      协作式取消中的关键类型是CancellationTokenSource。它有一个关键属性Token,Token是一个名为CancellationToken的值类型。CancellationToken继而进一步提供了布尔值的属性IsCancellationRequested作为需要取消工作的标识。CancellationToken还有一个方法尤其值得注意,那就是Register方法。它负责传递一个Action委托,在线程停止的时候被回调,使用方法如:

    cts.Token.Register(() =>
    {
       Console.WriteLine("工作线程被终止了。");
    });

      而且Task对象对CancellationTokenSource对象是天生支持的,在构造Task对象的时候就可以传进去CancellationTokenSource的实例。看一个网上的小例子:

    static void Main(string[] args)
    {
        CancellationTokenSource cts = new CancellationTokenSource();
        Task<int> t = new Task<int>(() => Add(cts.Token), cts.Token);
        t.Start();
        t.ContinueWith(TaskEnded);
        //等待按下任意一个键取消任务
        Console.ReadKey();
        cts.Cancel();
        Console.ReadKey();
    }
    
    static void TaskEnded(Task<int> task)
    {
        Console.WriteLine("任务完成,完成时候的状态为:");
        Console.WriteLine("IsCanceled={0}	IsCompleted={1}	IsFaulted={2}", task.IsCanceled, task.IsCompleted, task.IsFaulted);
        Console.WriteLine("任务的返回值为:{0}", task.Result);
    }
    
    static int Add(CancellationToken ct)
    {
        Console.WriteLine("任务开始……");
        int result = 0;
        while (!ct.IsCancellationRequested)
        {
            result++;
            Thread.Sleep(1000);
        }
        return result;
    }

      不过需要注意,像上面这么写,使用ct.IsCancellationRequested判断一下,如果取消信号被设定了,则退出任务,这种情况CLR会认为是成功结束的,这切实反应了程序员的期望,IsCanceled会返回false。如果想出现IsCanceled为true的情况,那么程序就要改写成:

    static void Main(string[] args)
    {
        CancellationTokenSource cts = new CancellationTokenSource();
        Task<int> t = new Task<int>(() => AddCancleByThrow(cts.Token), cts.Token);
        t.Start();
        t.ContinueWith(TaskEndedByCatch);
        //等待按下任意一个键取消任务
        Console.ReadKey();
        cts.Cancel();
        Console.ReadKey();
    }
    
    static void TaskEndedByCatch(Task<int> task)
    {
        Console.WriteLine("任务完成,完成时候的状态为:");
        Console.WriteLine("IsCanceled={0}	IsCompleted={1}	IsFaulted={2}", task.IsCanceled, task.IsCompleted, task.IsFaulted);
        try
        {
            Console.WriteLine("任务的返回值为:{0}", task.Result);
        }
        catch (AggregateException e)
        {
            e.Handle((err) => err is OperationCanceledException);
        }
    }
    
    static int AddCancleByThrow(CancellationToken ct)
    {
        Console.WriteLine("任务开始……");
        int result = 0;
        while (true)
        {
            ct.ThrowIfCancellationRequested();
            result++;
            Thread.Sleep(1000);
        }
        return result;
    }

      在任务结束求值的方法TaskEndedByCatch中,如果任务是通过ThrowIfCancellationRequested方法结束的,对任务求结果值将会抛出异常OperationCanceledException,而不是得到抛出异常前的结果值。这意味着任务是通过异常的方式被取消掉的,所以可以注意到上面代码的输出中,状态IsCancled为true。同时你会发现IsFaulted状态却还是等于false。这是因为ThrowIfCancellationRequested是协作式取消方式类型CancellationTokenSource的一个方法,CLR进行了特殊的处理。CLR知道这一行程序开发者有意为之的代码,所以不把它看作是一个异常(它被理解为取消)。要得到IsFaulted等于true的状态,自己手动在一个地方抛出一个异常试试就可以了。

      此外,CancellationTokenSource就是可以被多个Task共享的,这样可以取消一组任务。取消一组任务最简单的就是使用任务工厂。任务工厂支持多个任务之间共享相同的状态,如取消类型。通过使用任务工厂,可以同时取消一组任务:

    static void Main(string[] args)
    {
       CancellationTokenSource cts = new CancellationTokenSource();
       //等待按下任意一个键取消任务
       TaskFactory taskFactory = new TaskFactory();
       Task[] tasks = new Task[]
       {
          taskFactory.StartNew(() => Add(cts.Token)),
          taskFactory.StartNew(() => Add(cts.Token)),
          taskFactory.StartNew(() => Add(cts.Token))
       };
       //CancellationToken.None指示TasksEnded不能被取消
       taskFactory.ContinueWhenAll(tasks, TasksEnded, CancellationToken.None);
       Console.ReadKey();
       cts.Cancel();
       Console.ReadKey();
    }
            
    static void TasksEnded(Task[] tasks)
    {
       Console.WriteLine("所有任务已完成!");
    }

      好了,看完线程的正常取消,再来看一下线程的异常问题,这个在上面也简单说了一下,这是一种程序员不期望的线程结束的方式。

    线程的异常处理

      先看下面的例子:

    Task.Factory.StartNew(() =>
    {
        throw new Exception();
    });

       运行这段程序,你会发现根本没有异常抛出,线程中的异常会被线程忽略掉,这个是我们不需要的,我们需要知道异常发生了,并进行相应的处理。

      跟踪这种问题,通常记日志是一种常用方法。此外通过技术手段去捕获这些异常时另一种方式,这是这里讨论的重点。

      Task线程中未捕获的异常会在垃圾回收时终结器执行线程中被抛出。我们可以通过GC.Collect来强制垃圾回收从而引发终结器处理线程,此时Task的未捕获异常会被抛出。例如:

    //在Task中抛出异常
    Task.Factory.StartNew(() =>
    {
        throw new Exception();
    });
    //确保任务完成
    Thread.Sleep(100);
    //强制垃圾回收
    GC.Collect();
    //等待终结器处理
    GC.WaitForPendingFinalizers();

      好了,异常抛出,程序崩溃了。不过这个行为在.NET 4.5中又有所改变,直接运行这个程序并不会抛出异常,而在App.config中添加如下配置以后,异常才会抛出:

    <configuration>
        <runtime>
            <ThrowUnobservedTaskExceptions enabled="true"/>
        </runtime>
    </configuration>

      抛出异常,程序崩溃并不是程序员想要的行为,我们期望的是可以捕获异常并处理之。要达到这个目的,针对Task对象,我们可以采用的手段有这么几个:调用Task.Wait/WaitAll,或者引用Task<T>.Result属性(这个在上面的例子中已经使用了),或者最简单的引用Task.Exception属性来捕获Task的异常。

      例如通过Task.Wait手动捕获AggregateException:

    try
    {
        Task.WaitAll(
        Task.Factory.StartNew(() =>
        {
            throw new Exception();
        }));
    }
    catch (AggregateException)
    {
        // 处理异常
        //...... 
    }

      这样我们就捕获到了异常并可以处理它了。

      当然最简单的就是直接引用一下Task.Exception属性:

    Task.Factory.StartNew(() =>
    {
        throw new Exception();
    }).ContinueWith(t => { 
        var exp = t.Exception;
        // 处理异常
        //...... 
    });

      同样的,我们捕获了异常,并且处理掉异常就可以了,像上面例子中的处理方式就是忽略线程异常,没做任何处理。

      另外,可以通过TaskContinuationOptions.OnlyOnFaulted来使得只有在发生异常时才去执行ContinueWith中指定的行为,代码如下:

    Task.Factory.StartNew(() =>
    {
        throw new Exception();
    }).ContinueWith(t => { var exp = t.Exception; }, TaskContinuationOptions.OnlyOnFaulted);

      最后需要说明的是TaskScheduler.UnobservedTaskException事件,该事件是所有未捕获被抛出前的最后可以将其捕获的方法。通过UnobservedTaskExceptionEventArgs.SetObserved方法来将异常标记为已捕获。

    TaskScheduler.UnobservedTaskException += (s, e) =>
    {
        //设置所有未捕获异常被捕获
        e.SetObserved();
    };
    
    Task.Factory.StartNew(() =>
    {
        throw new Exception();
    });

       好了,Task的有关问题就总结到这里了,下面将总结一下并行计算方面的知识,它们与Task对象之间其实存在着千丝万缕的联系。

  • 相关阅读:
    Linux crontab 的常用定时方式
    Windows 查看端口及进程信息
    java.io.IOException: com.esotericsoftware.kryo.KryoException
    Linux 如何让挂载的硬盘永久生效
    六边形架构-微服务基石
    包和工具
    谈一谈对java简单的理解
    HTTP报文 「HTTP
    四层 or 七层 「HTTP
    setTimeout不生效
  • 原文地址:https://www.cnblogs.com/dxy1982/p/3632785.html
Copyright © 2020-2023  润新知