• 协程


    一.协程

    1.了解协程

    (1)并发:切换 + 保存状态(程序停止等待)

    (2)协程的含义:

      协程是一种用户态的轻量级线程,即协程是由用户程序自己控制调度的,是组成线程的各个函数

      协程本身没有实体,协程是在单线程的

    (3)为什么要有协程?

      因为想要在单线程内实现并发的效果.

        因为Cpython中有GIL锁,限制了在同一个时间点,只能执行一个线程,所有想要在执行一个线程的期间,充分利用CPU的性能,所以才有了想在单线程内饰并发的效果

    (4)CPU为什么要切换?

      ①因为某个程序阻塞了     ②因为某个程序用完了时间片

      很明显解决①这个问题才能提高效率,所以想要实现单线程的并发,就要解决在单线程内,多个任务函数中,某个任务函数遇见IO操作,马上自动切换到其它任务函数去执行

    2.yield生成器的特点

    yield生成器自带保存状态

    例如:

    def consumer():
    while 1:
    x = yield
    print(x)

    def product():
    g = consumer() #实例化一个对象 调用consumer函数,此时不执行consumer函数
    next(g) #此时执行consumer函数,但是执行到x = yield的时候就停止了,因为没有参数
    for i in range(100): #循环遍历
    g.send(i) #为yield传值 传完值之后,光标就在yield后面停止 等到下次执行的时候,继续先从x执行
    print("这是product函数")

    product() #首先调用product函数

    例如:

    def func():
    sum = 0
    while 1:
    yield sum

    g = func() #当程序执行到这里的时候,并不会执行func函数
    print(next(g)) #遇到第一个next(g)的时候从头到尾执行函数,一直执行到yield,然后光标停在yield后面
    print(next(g)) #第二次执行的时候,就直接从while循环开始执行

    总结:

      (1)yield只能实现单纯的切换函数和保存函数的状态的功能,不能够实现当某一个函数遇到IO操作阻塞时,自动地切换到另一个函数去执行

      (2)变成协程的目标:当某一个函数遇到IO操作阻塞时候,会自动地切换到另一个函数去执行,如果能实现这个功能,那么每一个函数都是一个协程,但是协程的本质还是依靠于yield实现的

      (3)如果只是拿yield去单纯的实现一个切换现象,你就会发现根本没有程序串行执行效率高

    3.greenlet模块

    能简单的实现函数与函数之间的切换,但是遇到IO操作,不能自动切换到其他函数中

      (1)注册一下,函数func,将函数注册成一个对象f

        f = greenlet(func)

      (2)调用func,使用f.switch(),如果func需要传参,就在switch这里传参即可

    当使用switch调用函数func 的时候,什么时候func会停止?

      (1)要么return     (2)要么在func内部又遇到了switch

    例如:

    from greenlet import greenlet

    def eat(name):
    print("%s吃炸鸡" % name) #执行这句话
    f2.switch("牛哞哞") #使用f2.switch调用drink这个函数,并为其传一个名字的参数
    print("%s吃蛋糕" % name)
    f2.switch() #又使用f2.switch调用drink这个函数

    def drink(name):
    print("%s喝啤酒" % name) #执行这句话
    f1.switch() #又使用f1.switch调用eat函数
    print("%s喝可乐" % name)
    f1 = greenlet(eat) #首先注册了两个对象,分别是f1和f2
    f2 = greenlet(drink)
    f1.switch("刘某某") #使用f1.switch调用eat这个函数,并为其传一个名字的参数

    4.gevent模块

    可以实现在某函数内部遇到IO操作阻塞,就会自动的切换到其它函数内部去执行

    g = gevent.spawn(func,参数)

    g.join()   让func函数执行完毕

    gevent.join([g1,g2,g3])   让多个函数执行完毕

    func停止的原因:

      (1)func执行完毕     (2)遇到IO操作的时候

    (1)例如:

    import gevent

    def func():
    print("1 2 3 4")
    gevent.sleep(1) #遇到IO操作,自动执行另一个函数
    print("3 2 3 4")
    gevent.sleep(1) #此时gevent不能识别到其它的IO操作,只能识别自己认识的IO操作(gevent.sleep())
    def func1():
    print("2 2 3 4")
    gevent.sleep(1) #再次遇到IO操作,又回到刚才那个函数去执行
    print("再来一次")
    g1 = gevent.spawn(func) #先注册一个func,将func注册成一个对象g1和g2
    g2 = gevent.spawn(func1)
    g1.join() #通过g1对象执行func函数

    (2)例如:解决gevent不能识别其它的IO操作

    from gevent import monkey
    import gevent
    monkey.patch_all() #可以让gevent识别大部分常用的IO操作
    import time

    def func():
    print("1 2 3 4")
    time.sleep(1)
    print("3 2 3 4")
    def func1():
    print("2 2 3 4")
    time.sleep(1)
    print("再来一次")
    g1 = gevent.spawn(func)
    g2 = gevent.spawn(func1)
    g1.join()
    g2.join()

    (3)例如:串行和并发的效率对比

      并发效率比串行快

    from gevent import monkey
    monkey.patch_all()
    import gevent
    import time

    def func(num):
    time.sleep(1)
    print(num)

    start = time.time()
    for i in range(10): #串行
    func(i)
    print(time.time() - start)


    start = time.time()
    l = []
    for i in range(10):
    g = gevent.spawn(func,i) #协程去并发实现执行任务函数
    l.append(g)
    gevent.joinall(l) #等待l里面的全部函数执行完毕
    print(time.time() - start)

    (4)爬虫实例

    from gevent import monkey
    monkey.patch_all()
    import gevent
    import time
    import requests
    def get_result(url):
    res = requests.get(url)
    print(url,res.status_code,len(res.text))

    url_l = ['http://www.baidu.com',
    'https://www.jd.com',
    'http://www.apache.com',
    'http://www.taobao.com',
    'http://www.qq.com',
    'http://www.mi.com',
    'http://www.cnblogs.com']

    def sync_func(url_l):
    '''同步调用'''
    for url in url_l:
    get_result(url)

    def async_func(url_l):
    '''异步'''
    l = []
    for url in url_l:
    l.append(gevent.spawn(get_result,url))
    gevent.joinall(l)

    start = time.time()
    sync_func(url_l)
    print('sync:',time.time() - start)

    start = time.time()
    async_func(url_l)
    print('async:',time.time() - start)

    5.大的总结   (面试题)

    (1)协程是由用户自己去调度的

    (2)计算密集用多进程,可以充分利用多核CPU的性能

    (3)IO密集用多线程(协程是单线程的)

    (4)多线程和协程的区别:

      ①线程是由操作系统调度,控制

      ②协程是由程序员自己调度,控制

    二.IO多路复用

    1.阻塞IO

    2.非阻塞IO

    3.多路复用IO

    4.异步IO   (python实现不了,但是有tornado框架,天生自带异步)

    例子一:用非阻塞IO模型解决阻塞IO

    服务器端代码:

    import socket
    sk = socket.socket()
    sk.setblocking(False)
    sk.bind(('127.0.0.1',8080))
    sk.listen()

    l = []
    del_l = []
    while 1:
    try:
    conn,addr = sk.accept()# 如果是阻塞IO模型,在这里程序会一直等待。
    l.append(conn)# 将每个请求连接的客户端的conn添加到列表中
    except BlockingIOError:
    for conn in l:# 去遍历所有客户端的conn,看看有没有客户端给我发送数据了

    try:
    info = conn.recv(1024).decode('utf-8')# 尝试接收,看看有没有客户端给我发数据
    if not info:# 如果客户端正常执行了close,服务器会接收到一个空
    del_l.append(conn)# 将已经结束的客户端的conn,添加到要删除的列表中
    print('客户端正常退出了!')
    conn.close()# 因为客户端已经主动close,所以服务器端的conn也要close
    else:
    print(info)
    conn.send(info.upper().encode('utf-8'))
    except BlockingIOError:
    continue# 是没有接受到客户端发来的数据而报错
    except ConnectionResetError:
    pass# 是因为客户端强制退出而报错
    if del_l:
    for conn in del_l:
    l.remove(conn)
    del_l = []# 在删除完主动关闭的客户端的连接之后,应该把此列表清空,否则报错

    客户端代码:

    import socket
    sk = socket.socket()
    sk.connect(('127.0.0.1',8080))

    while 1:
    msg_s = input('>>>')
    if not msg_s:continue
    if msg_s == 'q':break
    sk.send(msg_s.encode('utf-8'))
    print(sk.recv(1024).decode('utf-8'))
    sk.close()

    例子二:基于select的网络IO模型

    服务器端代码:

    import select
    import socket

    sk = socket.socket()
    sk.bind(('127.0.0.1',8080))
    sk.listen()
    del_l = []
    rlist = [sk]# 是用来让select帮忙监听的 所有 接口
    # select:windows/linux是监听事件有没有数据到来
    # poll: linux 也可以做select的工作
    # epoll: linux 也可以做类似的工作
    while 1:
    r,w,x = select.select(rlist,[],[])# 传参给select,当rlist列表中哪个接口有反应,就返回给r这个列表
    if r:
    for i in r:# 循环遍历r,看看有反应的接口到底是sk 还是conn
    if i == sk:
    # 如果是sk,那就表示有客户端的连接请求
    '''sk有数据要接收,代表着有客户端要来连接'''
    conn,addr = i.accept()
    rlist.append(conn)# 把新的客户端的连接,添加到rlist,继续让select帮忙监听
    else:
    # 如果是conn,就表示有客户端给我发数据了
    '''conn有数据要接收,代表要使用recv'''
    try:
    msg_r = i.recv(1024).decode('utf-8')
    if not msg_r:
    '''客户端执行了close,客户端主动正常关闭连接'''
    del_l.append(i)
    i.close()
    else:
    print(msg_r)
    i.send(msg_r.upper().encode('utf-8'))
    except ConnectionResetError:
    pass
    if del_l:# 删除那些主动断开连接的客户端的conn
    for conn in del_l:
    rlist.remove(conn)
    del_l.clear()

    客户端代码:

    import socket
    sk = socket.socket()
    sk.connect(('127.0.0.1',8080))

    while 1:
    msg_s = input('>>>')
    if not msg_s:continue
    if msg_s == 'q':break
    sk.send(msg_s.encode('utf-8'))
    print(sk.recv(1024).decode('utf-8'))
    sk.close()

    面试题

      select 和 poll 和 epoll区别

    (1)select 和 poll 有一个共同的机制,都是采用轮询的方式去询问内核,有没有数据准备好了

    (2)select 有一个最大监听事件的限制,32位机限制1024,6位机限制2048

    (3)poll没有,理论上poll可以开启无限大,1G内存大概够你开10W个事件去监听

    (4)epoll是最好的,采用的是回调机制,解决了select和poll共同存在的问题

        而且epoll理论上也可以开启无限多个监听事件

  • 相关阅读:
    常见协议基础知识总结--FTP协议
    DG增量恢复
    DG备库无法接受主库归档日志之密码文件
    Oracle密码概要文件,密码过期时间180天修改为3天,相关用户密码是否过期
    ORA-15025 搭建DG环境,restore controlfile报错,提示oracle无法使用ASM存储
    Deinstall卸载RAC之Oracle软件及数据库+GI集群软件
    增加临时表空间组Oracle11g单实例
    安装12C小问题及pdb表空间配置
    判断子表外键约束参数类型
    创建small表空间size32G报错ORA-01144
  • 原文地址:https://www.cnblogs.com/lhy979/p/9549685.html
Copyright © 2020-2023  润新知