协程简介
协程(coroutine),又称为微线程,纤程,是一种用户级的轻量级线程。协程拥有自己的寄存器上下文和栈。
协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来时,恢复之前保存的上下文
和栈。因此协程能保存上一次调用的状态,每次协程重入时,相当于进入上一次调用的状态。
在并发编程中,协程与线程类似,每个协程表示一个执行单元,有自己的本地数据,
与其他协程共享全局数据和其他资源。
协程需要用户自己来编写调度逻辑,对于CPU的切换来说,协程是单进程,所以CPU不用
去考虑怎么调度、切换上下文,这就省去了CPU的切换开销,所以协程在一定程度上又好于多线程。
Python通过yield提供了对协程的基本支持,但是不完全,而使用第三方gevent库是更好的选择,
gevent提供了比较完善的协程支持。gevent是一个基于协程的Python网络函数库,使用greenlet在
libev事件循环顶部提供了一个高级别并发性的API。主要特性有以下几点:
- 基于libev的快速事件循环,Linux上是epoll机制。
- 基于greenlet的轻量级执行单位。
- API复用了Python标准库里的内容。
- 支持SSL的协作式sockets。
- 可通过线程池或c-ares实现DNS查询。
目录
在了解协程之前,需要先了解一下生成器中的yield,它不仅可以当做生成器,还能当做一个表达式来使用(yield)
def func(): x = (yield) print(x) x = (yield) g = func() print(next(g)) # 这是第一个yield,就暂停了 g.send('hello world') # 恢复暂停位置,将第一个yield赋值, # x = hello world,然后又执行到yield,暂停 --> None hello world Process finished with exit code 0
需要注意的是: send跟next一样,可以继续暂停的执行,并把send括号里面的东西变成返回值
没有next开始,就不能使用send!
import random, time def consumer(): while True: item = (yield) # 接收send的传递内容 print('消费了%s' % item) time.sleep(1) def producer(consumer): # 主函数 next(consumer) # 开启协程 while True: item = random.randint(0, 99) print('生产了%s' % item) consumer.send(item) # 发送 time.sleep(1) c = consumer() # 生成器对象 producer(c)
greenlet属于三方库,通过 pip install greenlet 安装
什么是greenlet呢?
CPython(标准python)能够通过生成器来实现协程,但使用起来并不方便而python的衍生版Stackless python,实现了原生的协程,便于利用。
于是将stackless中关于协程的代码单独拿出来做成了CPython的扩展包
也就是python环境下的原生协程包
greenlet的价值
一 高性能的远程协程
二 语义更加明确的显示切换
三 直接将函数包装成协程,保持原有代码风格
greenlet下的生产者与消费者问题
from greenlet import greenlet from time import sleep from random import randint def consumer(): while True: item = p.switch() # 切换p,开始暂停,等待恢复(只有恢复的时候才能收到数据) print('消费了%s' % item) sleep(1) def producer(): while True: item = randint(0, 99) print('生产了%s' % item) c.switch(item) # 暂停当前协程,并且切换到指定的协程,传参 sleep(1) c = greenlet(consumer) # 直接封装成协程 p = greenlet(producer) c.switch() # 相当于next的作用,开启协程
什么是gevent?
gevent开始之前可以先了解一下IO多路复用的epoll
gevent通过封装了libev(基于epoll)和greenlet两个库,可以实现类似线程方式的协程
gevent = epoll + greenlet
gevent的价值是什么?
遇到阻塞就切换到另一个协程继续执行
一 使用基于epoll的libev来避开阻塞
二 使用基于gevent的高效协程来切换执行
三 只有阻塞的时候切换,没有轮询的开销,也没有线程的开销
实现方法:
通过 monkey patching功能使得第三方模块变成协作式。
gevent对协程的支持,本质上是 greenlet在实现切换工作。 greenlet工作流程如下:
假如进行访问网络的IO操作时,出现阻塞, greenlet就显式切换到另一段没有被阻塞的代码段执行,
直到原先的阻塞状况消失以后,再自动切换回原来的代码段继续处理。因此, greenlet是一种合理安排的串行方式。
由于IO操作非常耗时,经常使程序处于等待状态,有了 gevent为我们自动切换协程,
就保证总有 greenlet在运行,而不是等待IO,这就是协程一般比多线程效率高的原因。
由于切换是在IO操作时自动完成,所以 gevent需要修改 Python自带的一些标准库,将一些常见的阻塞,
如 socket、 select等地方实现协程跳转,这一过程在启动时通过 monkey patch完成。
gevent实现并发服务器
from gevent import monkey; monkey.patch_socket() # 猴子补丁,将socket替换成一个封装了epoll的socket from socket import socket import gevent server = socket() # 封装好的socket server.bind(('', 7788)) server.listen(1000) def recv(conn): while True: recv_date = conn.recv(1024).decode() if recv_date: print(recv_date) conn.send(recv_date.encode()) else: conn.close() while True: conn, addr = server.accept() # 生成一个协程,并将conn作为参数传入 gevent.spawn(recv, conn)
gevent实现生产者与消费者问题
import gevent from gevent import monkey; monkey.patch_all() # all是所有的能切换成协程的地方全部切换,他包含了socket,一般情况下都是用all from random import randint from time import sleep from gevent.queue import Queue # gevent里面的队列 queue = Queue(3) def consumer(): while True: item = queue.get() # 空就阻塞 print('消费了%s' % item) sleep(1) def producer(): while True: item = randint(0, 99) queue.put(item) # 满就阻塞 epoll阻塞就切换 print('生产了%s' % item) sleep(1) c = gevent.spawn(consumer) #封装成协程 p = gevent.spawn(producer) gevent.joinall([c, p]) # 等待传入协程结束