异步io的说白了就是遇到io操作的时候,就停下来去做别的事情。io分网络io和磁盘io,网络io比如说打开一个网站获取数据,下载一首歌等等,磁盘io就是把数据存到一个文件里面,写到磁盘上。
从网站上获取数据或者把数据写到磁盘上都是需要时间的,那就得等待了,这样的话,很多任务的时候就比较慢了,而异步io就可以遇到io操作的时候,就切换到别的任务去做别的事情,这样子效率就很高了。
举个例子,你去银行办业务,排队的人很多,那你就得等待了,等待的时候你又不能走, 也不能干其他事,效率就比较低了。异步io就是你去办业务了,需要等待,那你放双鞋或者其他的东西,在这排这,然后你去做其他的事情,银行的业务办完了,他通知你再回来拿。
实现异步io是用的协程,协程是微线程,其实只有一个线程在干活,这个线程遇到io操作的时候就切换走了,去做别的事情,避免了多线程的时候多个线程之间切换线程,浪费资源,所以他的效率要比多线程高。
gevent实现的原理就是生成器实现的,它是基于greenlet封装的,用起来很简单,代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
import gevent
from gevent import monkey
import requests
monkey.patch_all()
#猴子补丁,如果不打这个遇到io操作的时候还是串行的
def run(url,name):
#下载网页
r = requests.get(url)#这个就是io操作,
open(name+'.html','wb').write(r.content)#写文件也是io操作,遇到io的时候就会自动切换
urls = {
'baidu':'http://www.baidu.com',
'nnzhp':'http://www.nnzhp.cn',
'besttest':'http://www.besttest.cn',
'dsx':'http://www.imdsx.cn'
}
for name,url in urls.items():
g = gevent.spawn(run,url,name)#启动
g.join()#切换
|
进程、线程、协程对比。
- 有一个老板想要开个工厂进行生产某件商品(例如剪子)
- 他需要花一些财力物力制作一条生产线,这个生产线上有很多的器件以及材料这些所有的 为了能够生产剪子而准备的资源称之为:进程
- 只有生产线是不能够进行生产的,所以老板的找个工人来进行生产,这个工人能够利用这些材料最终一步步的将剪子做出来,这个来做事情的工人称之为:线程
- 这个老板为了提高生产率,想到3种办法:
- 在这条生产线上多招些工人,一起来做剪子,这样效率是成倍増长,即单进程 多线程方式
- 老板发现这条生产线上的工人不是越多越好,因为一条生产线的资源以及材料毕竟有限,所以老板又花了些财力物力购置了另外一条生产线,然后再招些工人这样效率又再一步提高了,即多进程 多线程方式
- 老板发现,现在已经有了很多条生产线,并且每条生产线上已经有很多工人了(即程序是多进程的,每个进程中又有多个线程),为了再次提高效率,老板 想了个损招,规定:如果某个员工在上班时临时没事或者再等待某些条件(比如等待另一个工人生产完谋道工序 之后他才能再次工作) ,那么这个员工就利用这个时间去做其它的事情,那么也就是说:如果一个线程等待某些条件,可以充分利用这个时间去做其它事情,其实这就是:协程方式