Net异步编程知多少
1. 引言
最近在学习Abp框架,发现Abp框架的很多Api都提供了同步异步两种写法。异步编程说起来,大家可能都会说异步编程性能好。但好在哪里,引入了什么问题,以及如何使用,想必也未必能答的上来。
自己对异步编程也不是很了解,今天就以学习的目的,来梳理下同步异步编程的基础知识,然后再来介绍下如何使用async/await进行异步编程。下图是一张大纲,具体可查看脑图分享链接。
2. 同步异步编程
同步编程是对于单线程来说的,就像我们编写的控制台程序,以main方法为入口,顺序执行我们编写的代码。
异步编程是对于多线程来说的,通过创建不同线程来实现多个任务的并行执行。
3. 线程
.Net 1.0就发布了System.Threading,其中提供了许多类型(比如Thread、ThreadStart等)可以显示的创建线程。
说到Thread,我们需要了解以下几个概念:
3.1. 什么是主线程
每一个Windows进程都恰好包含一个用作程序入口点的主线程。进程的入口点创建的第一个线程被称为主线程。.Net执行程序(控制台、Windows Form、Wpf等)使用Main()方法作为程序入口点。当调用该方法时,主线程被创建。
3.2. 什么是工作者线程
由主线程创建的线程,可以称为工作者线程,用来去执行某项具体的任务。
3.3. 什么是前台线程
默认情况下,使用Thread.Start()方法创建的线程都是前台线程。前台线程能阻止应用程序的终结,只有所有的前台线程执行完毕,CLR才能关闭应用程序(即卸载承载的应用程序域)。前台线程也属于工作者线程。
3.4. 什么是后台线程
后台线程不会影响应用程序的终结,当所有前台线程执行完毕后,后台线程无论是否执行完毕,都会被终结。一般后台线程用来做些无关紧要的任务(比如邮箱每隔一段时间就去检查下邮件,天气应用每隔一段时间去更新天气)。后台线程也属于工作者线程。
说了这么多概念不如来段代码:
//主线程入口
static void Main(string[] args)
{
Console.WriteLine("主线程开始!");
//创建前台工作线程
Thread t1 = new Thread(Task1);
t1.Start();
//创建后台工作线程
Thread t2= new Thread(new ParameterizedThreadStart(Task2));
t2.IsBackground = true;//设置为后台线程
t2.Start("传参");
}
private static void Task1()
{
Thread.Sleep(1000);//模拟耗时操作,睡眠1s
Console.WriteLine("前台线程被调用!");
}
private static void Task2(object data)
{
Thread.Sleep(2000);//模拟耗时操作,睡眠2s
Console.WriteLine("后台线程被调用!" + data);
}
执行发现,【后台线程被调用】将不会显示。因为当所有的前台线程执行完毕后,应用程序就关闭了,不会等待所有的后台线程执行完毕,所以不会显示。
4. ThreadPool(线程池)
线程池是为突然大量爆发的线程设计的,通过有限的几个固定线程为大量的操作服务,减少了创建和销毁线程所需的时间,从而提高效率,这也是线程池的主要好处。
ThreadPool适用于并发运行若干个任务且运行时间不长且互不干扰的场景。
还有一点需要注意,通过线程池创建的任务是后台任务。
举个例子:
//主线程入口
static void Main(string[] args)
{
Console.WriteLine("主线程开始!");
//创建要执行的任务
WaitCallback workItem = state => Console.WriteLine("当前线程Id为:" + Thread.CurrentThread.ManagedThreadId);
//重复调用10次
for (int i = 0; i < 10; i++)
{
ThreadPool.QueueUserWorkItem(workItem);
}
Console.ReadLine();
}
从图中可以看出,程序并没有每次执行任务都创建新的线程,而是循环利用线程池中维护的线程。
如果去掉最后一句Consoler.ReadLine()
,会发现程序仅输出【主线程开始!】就直接退出,从而确定ThreadPool创建的线程都是后台线程。
5. System.Threading.Tasks
.Net 4.0引入了System.Threading.Tasks,简化了我们进行异步编程的方式,而不用直接与线程和线程池打交道。
System.Threading.Tasks中的类型被称为任务并行库(TPL)。TPL使用CLR线程池(说明使用TPL创建的线程都是后台线程)自动将应用程序的工作动态分配到可用的CPU中。
5.1. Parallel(数据并行)
数据并行是指使用Parallel.For()或Parallel.ForEach()方法以并行方式对数组或集合中的数据进行迭代。
看怎么用:
ParallelLoopResult result = Parallel.For(0, 10000, i => {
Console.WriteLine("{0}, task: {1} , thread: {2}", i, Task.CurrentId, Thread.CurrentThread.ManagedThreadId);
});
5.2. PLINQ(并行LINQ查询)
为并行运行而设计的LINQ查询为PLINQ。System.Linq命名空间的ParallelEnumerable中包含了一些扩展方法来支持PINQ查询。
使用举例:
int[] modThreeIsZero = (from num in source.AsParallel()
where num % 3 == 0
orderby num descending
select num).ToArray();
5.3. Task
Task,字面义,任务。使用Task类可以轻松地在次线程中调用方法。
static void Main(string[] args)
{
Console.WriteLine("主线程ID:" + Thread.CurrentThread.ManagedThreadId);
Task.Factory.StartNew(() => Console.WriteLine("Task对应线程ID:" + Thread.CurrentThread.ManagedThreadId));
Console.ReadLine();
}
可以看见,使用Task我们不必理会具体线程的创建。
我们也可以使用.NET 4.5引入的Task.Run静态方法来启动一个线程。
static void Main(string[] args)
{
Console.WriteLine("主线程ID:" + Thread.CurrentThread.ManagedThreadId);
Task.Run(() => Console.WriteLine("Task对应线程ID:" + Thread.CurrentThread.ManagedThreadId));
Console.ReadLine();
}
Task类提供了Wait()方法,用来等待线程task执行完毕。
5.4. 泛型Task
Task是Task的泛型版本,可以接收一个返回值。
static void Main(string[] args)
{
Console.WriteLine("主线程ID:" + Thread.CurrentThread.ManagedThreadId);
Task<string> task = Task.Run(() =>
{
return Thread.CurrentThread.ManagedThreadId.ToString();
});
Console.WriteLine("创建Task对应的线程ID:" + task.Result);
Console.ReadLine();
}
Task提供了很多方法,帮助我们进行异步任务。了解更多,可参考MSDN。
5.5. async/await 特性
C# async关键字用来指定某个方法、Lambda表达式或匿名方法自动以异步的方式来调用。
咱们先来看一个具体的示例吧。
private static void Main(string[] args)
{
Console.WriteLine("主线程启动,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
var task = GetLengthAsync();
Console.WriteLine("回到主线程,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
Console.WriteLine("线程[" + Thread.CurrentThread.ManagedThreadId + "]睡眠5s:");
Thread.Sleep(5000); //将主线程睡眠5s
var timer = new Stopwatch();
timer.Start(); //开始计算时间
Console.WriteLine("task的返回值是" + task.Result);
timer.Stop(); //结束点,另外stopwatch还有Reset方法,可以重置。
Console.WriteLine("等待了:" + timer.Elapsed.TotalSeconds + "秒"); //显示时间
Console.WriteLine("主线程结束,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
}
private static async Task<int> GetLengthAsync()
{
Console.WriteLine("GetLengthAsync()开始执行,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
var str = await GetStringAsync();
Console.WriteLine("GetLengthAsync()执行完毕,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
return str.Length;
}
private static Task<string> GetStringAsync()
{
Console.WriteLine("GetStringAsync()开始执行,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
return Task.Run(() =>
{
Console.WriteLine("异步任务开始执行,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
Console.WriteLine("线程[" + Thread.CurrentThread.ManagedThreadId + "]睡眠10s:");
Thread.Sleep(10000); //将异步任务线程睡眠10s
Console.WriteLine("GetStringAsync()执行完毕,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
return "GetStringAsync()执行完毕";
});
}
是不是对执行结果感到惊讶?惊讶是对的,且听我们下面娓娓道来。
- 被async标记的方法,意味着可以在方法内部使用await,这样该方法将会在一个await point(等待点)处被挂起,并且在等待的实例完成后该方法被异步唤醒。【注意:await point(等待点)处被挂起,并不是说在代码中使用
await SomeMethodAsync()
处就挂起,而是在进入SomeMethodAsync()
真正执行异步任务时被挂起,切记,切记!!!】 - async标记的方法,返回值类型为
void
、Task
、Task<T>
。 - 被async标记的方法,方法的执行结果或者任何异常都将直接反映在返回类型中。
- 不是被async标记的方法,就会被异步执行,刚开始都是同步开始执行。换句话说,方法被async标记不会影响方法是同步还是异步的方式完成运行。事实上,async使得方法能被分解成几个部分,一部分同步运行,一些部分可以异步的运行(而这些部分正是使用await显示编码的部分),从而使得该方法可以异步的完成。
- await关键字告诉编译器在async标记的方法中插入一个可能的挂起/唤醒点。 逻辑上,这意味着当你写
await someMethod();
时,编译器将生成代码来检查someMethod()
代表的操作是否已经完成。如果已经完成,则从await标记的唤醒点处继续开始同步执行;如果没有完成,将为等待的someMethod()
生成一个continue委托,当someMethod()
代表的操作完成的时候调用continue委托。这个continue委托将控制权重新返回到async方法对应的await唤醒点处。
返回到await唤醒点处后,不管等待的someMethod()
是否已经经完成,任何结果都可从Task中提取,或者如果someMethod()
操作失败,发生的任何异常随Task一起返回或返回给SynchronizationContext
。
从第4点可以解释为什么上面的demo当调用GetLengthAsync();
方法时,输出GetLengthAsync()开始执行,当前线程为:1
。
从第1点可以解释调用await GetStringAsync();
后,为什么程序会继续同步执行输出GetStringAsync()开始执行,当前线程为:1
。
当执行到Task.Run的时候,就回到了主线程,从而输出回到主线程,当前线程为:1
,这说明Task.Run就是我们所说的await point(等待点)。紧接着代码将主线程睡眠5s,这时异步任务可不会歇啊,所以会输出异步任务开始执行,当前线程为:3
。
紧接着为了模拟异步任务耗时,我们在异步任务中调用Thread.Sleep(10000)
将异步任务睡眠10s。
同样异步任务睡眠的时候,不会影响到我们的同步任务,主线程睡眠5s后,要去输出task.Result
,这时异步任务还没有执行完毕,所以主线程会等待,直到结果返回,当异步任务完成后会输出GetStringAsync()执行完毕,当前线程为:3
。
从第5点可以解释,await等待异步任务完成后,GetLengthAsync()
方法被异步唤醒,从而异步执行后续代码而输出GetLengthAsync()执行完毕,当前线程为:3
。
代码中我们用StopWatch来计算大致等待了多久,从结果看等待了5.0004334秒,符合预期(异步线程睡眠了10s,主线程睡眠了5s,两个线程是并行运行的,所以大致耗时应该为10s - 5s = 5s)。
那为什么执行到task.Result
时,主线程会等待呢,你可能会说异步任务没有完成。
那异步任务没有完成不应该影响主线程的继续执行啊,那主线程究竟是被谁挂起进行等待的呢?
首先Task和Task是awaitable的,这里就要理解下awaitable这个概念,详参await anything,这里就不再赘述(讲清楚估计得另开一篇)。
这里就暂且把awaitable理解为可等待的,就是说如果这个task没执行完毕,在去取结果的时候它就会等待。
我们直接来看一下看下源码吧:
从代码中我们可以清楚看见,在去取task的返回值时,程序回去判断对应的任务是否执行完毕(IsCompleted),若没有则继续等待,也就是在InternalWait
方法中执行等待,而InternalWait
方法中指定等待的方式为TaskWaitBehavior.Synchronous
也就是同步等待,所以就会挂起主线程。
其实task.Wait()也是类似的逻辑,会同步阻塞主线程去等待异步线程执行完毕。
那我们就可以这样理解task.Result,task.Result相当于执行task.Wait();
后再去取值task.Result;
。
6. 总结
本文主要梳理了以下几点:
- 默认创建的Thread是前台线程,创建的Task为后台线程。
- ThreadPool创建的线程都是后台线程。
- 任务并行库(TPL)使用的是线程池技术。
- 调用async标记的方法,刚开始是同步执行的,只有当执行到await标记的方法中的异步任务时,才会挂起。
异步编程的水很深,标题起大了,有很多知识点没有讲全讲到。
文章中所写是个人理解,难免有纰漏之处,请大家以怀疑的精神阅读此文,也恳请大家多多指教!!!