• 034_协程


    前言

      之前我们学习了线程、进程的概念,了解了在操作系统中进程是资源分配的最小单位,线程是CPU调度的最小单位。按道理来说我们已经算是把cpu的利用率提高很多了。但是我们知道无论是创建多进程还是创建多线程来解决问题,都要消耗一定的时间来创建进程、创建线程、以及管理他们之间的切换。

      随着我们对于效率的追求不断提高,基于单线程来实现并发又成为一个新的课题,即只用一个主线程(很明显可利用的cpu只有一个)情况下实现并发。这样就可以节省创建线进程所消耗的时间。

      为此我们需要先回顾下并发的本质:切换+保存状态

       cpu正在运行一个任务,会在两种情况下切走去执行其他的任务(切换由操作系统强制控制),一种情况是该任务发生了阻塞,另外一种情况是该任务计算的时间过长(每个程序运行一段时间,切换进行)

        

      ps:在介绍进程理论时,提及进程的三种执行状态,而线程才是执行单位,所以也可以将上图理解为线程的三种状态 

       一:其中第二种情况并不能提升效率,只是为了让cpu能够雨露均沾,实现看起来所有任务都被“同时”执行的效果,如果多个任务都是纯计算的,这种切换反而会降低效率。

      二:第一种情况的切换。在任务一遇到io情况下,切到任务二去执行,这样就可以利用任务一阻塞的时间完成任务二的计算,效率的提升就在于此。

    协程介绍

      协程:是单线程下的并发,又称微线程,纤程。英文名Coroutine。一句话说明什么是线程:协程是一种用户态的轻量级线程,即协程是由用户程序自己控制调度的。

      协程如何实现并发?
         对于协程来说,始终是一个线程,只是不同的程序块在一个线程内交替执行,实现并发。

    1,如何实现在两个程序之间切换?

      1.1,可以通过  yield  来实现

    def func1():
        print(1)
        yield
        print(3)
        yield
    
    def func2():
        g = func1()
        next(g)
        print(2)
        next(g)
        print(4)
    
    func2()
    

     

    def consumer():
        while True:
            n = yield
            print('消费了一个包子%s'%n)
    
    def producer():
        g =  consumer()
        next(g)
        for i in range(10):
            print('生产了包子%s'%i)
            g.send(i)
    
    producer()
    用上面的方法yield实现一个消费者模型

      但是 yield 无法处理IO操作

    2,

      需要强调的是:

    #1. python的线程属于内核级别的,即由操作系统控制调度(如单线程遇到io或执行时间过长就会被迫交出cpu执行权限,切换其他线程运行)
    #2. 单线程内开启协程,一旦遇到io,就会从应用程序级别(而非操作系统)控制切换,以此来提升效率(!!!非io操作的切换与效率无关

      对比操作系统控制线程的切换,用户在单线程内控制协程的切换

      优点如下:

    #1. 协程的切换开销更小,属于程序级别的切换,操作系统完全感知不到,因而更加轻量级
    #2. 单线程内就可以实现并发的效果,最大限度地利用cpu

      缺点如下:

    #1. 协程的本质是单线程下,无法利用多核,可以是一个程序开启多个进程,每个进程内开启多个线程,每个线程内开启协程
    #2. 协程指的是单个线程,因而一旦协程出现阻塞,将会阻塞整个线程

      总结协程特点:

    1. 必须在只有一个单线程里实现并发
    2. 修改共享数据不需加锁
    3. 用户程序里自己保存多个控制流的上下文栈
    4. 附加:一个协程遇到IO操作自动切换到其它协程(如何实现检测IO ?yield、greenlet都无法实现,就用到了gevent模块(select机制))

    Greenlet模块

      cmd命令行安装 :pip3 install greenlet

    1,greenlet实现状态切换

    # from greenlet import greenlet   # 在单线程中切换状态的模块
    # def eat1():
    #     print('吃鸡腿1')
    #     g2.switch()
    #     print('吃鸡翅2')
    #     g2.switch()
    #
    # def eat2():
    #     print('吃饺子1')
    #     g1.switch()
    #     print('白切鸡')
    #
    # g1 = greenlet(eat1)
    # g2 = greenlet(eat2)
    # g1.switch()
    

      单纯的切换(在没有io的情况下或者没有重复开辟内存空间的操作),反而会降低程序的执行速度

    #顺序执行
    import time
    def f1():
        res=1
        for i in range(100000000):
            res+=i
    
    def f2():
        res=1
        for i in range(100000000):
            res*=i
    
    start=time.time()
    f1()
    f2()
    stop=time.time()
    print('run time is %s' %(stop-start)) #10.985628366470337
    
    #切换
    from greenlet import greenlet
    import time
    def f1():
        res=1
        for i in range(100000000):
            res+=i
            g2.switch()
    
    def f2():
        res=1
        for i in range(100000000):
            res*=i
            g1.switch()
    
    start=time.time()
    g1=greenlet(f1)
    g2=greenlet(f2)
    g1.switch()
    stop=time.time()
    print('run time is %s' %(stop-start)) # 52.763017892837524
    效率对比

    2,

    # 代码之间切换执行 反而会降低效率,因为切换不能规避IO时间。
    # 虽然两个程序都在执行,但是,并不是同时都在执行,与分别执行相比并没有减少IO时间
    # yield greenlet 都不能在切换的时候 规避IO时间
    # 如果 在同一个程序中 有IO的情况下 才切换  会让效率提高很多

    # import time
    # from greenlet import greenlet   # 在单线程中切换状态的模块
    # def eat1():
    #     print('吃鸡腿1')
    #     g2.switch()    # 切换到g2对象执行
    #     time.sleep(5)  # 代表执行此处代码消耗的时间
    #     print('吃鸡翅2')
    #     g2.switch()
    #
    # def eat2():
    #     print('吃饺子1')
    #     g1.switch()     # 切换到g1执行,上次没执行完继续。
    #     time.sleep(3)  # 代表执行此处代码消耗的时间
    #     print('白切鸡')
    #
    # g1 = greenlet(eat1)
    # g2 = greenlet(eat2)
    # g1.switch()  # 切换到g1对象执行
    # gevent内部封装了greenlet模块
    View Code

    Gevent模块

    cmd命令行安装:pip3 install gevent

    # gevent内部封装了greenlet模块

    1, 使用

    from gevent
    
    from threading import current_thread # 查看什么线程
    
    def func1():
        print(current_thread().name)  # dummythread 本程序是虚拟线程
        print(123)
        gevent.sleep(1)  # 自动切换到g2 # time.sleep(1) 不切换
        print(456)
    
    def func2():
        print(current_thread().name)   # dummythread
        print('hahaha')
        gevent.sleep(1)  # 自动切换到g1
        print('10jq')
    
    g1 = gevent.spawn(func1)   # 遇见他认识的io会自动切换的模块
    g2 = gevent.spawn(func2)
    # 不加下面两句没有结果,上面的事实运行了,
    # 但是这两个对象已经提交出去了,和本程序是异步的,
    # 不加下面两句本程序就执行完了,并结束。
    # g1.join()
    # g2.join()
    使用

    2,不是自带的IO操作不认识怎么办?

    from gevent import monkey;monkey.patch_all()
     # 将这句代码下面导入的所有IO模块都打成包,在使用时就会认识。
    import time
    

      # IO模块:time     socket     urllib    requests

    3,效率对比

      在一个线程下执行的

    from gevent import monkey;monkey.patch_all()
    import time
    import gevent
    
    def task(args):
        time.sleep(1)
        print(args)
    
    def sync_func():   # 同步
        for i in range(10):
            task(i)
    
    def async_func(): # 异步
        g_l = []
        for i in range(10):
            g_l.append(gevent.spawn(task,i))   # 给写成任务传参数
        gevent.joinall(g_l)
    
    start = time.time()
    sync_func()   # 同步
    print(time.time() - start)
    
    start = time.time()
    async_func()  # 异步
    print(time.time() - start)
    效率对比

    4,爬取网页信息的例子

    def get_url(url):
        res = requests.get(url)
        print(url,res.status_code,len(res.text))
    
    url_lst =[
        'http://www.sohu.com',
        'http://www.baidu.com',
        'http://www.qq.com',
        'http://www.python.org',
        'http://www.cnblogs.com',
        'http://www.mi.com',
        'http://www.apache.org',
        'https://www.taobao.com',
        'http://www.360.com',
        'http://www.7daysinn.cn/'
    ]
    
    start = time.time()
    for url in url_lst:
        get_url(url)
    print(time.time() - start)
    
    g_lst = []
    start = time.time()
    for url in url_lst:
        g = gevent.spawn(get_url,url)
        g_lst.append(g)
    gevent.joinall(g_lst)
    print(time.time() - start)
    爬网页的例子

    5,通过gevent实现单线程下的socket并发

      注意 :from gevent import monkey;monkey.patch_all()一定要放到导入socket模块之前,否则gevent无法识别socket的阻塞

    from gevent import monkey;monkey.patch_all()
    from socket import *
    import gevent
    
    #如果不想用money.patch_all()打补丁,可以用gevent自带的socket
    # from gevent import socket
    # s=socket.socket()
    
    def server(server_ip,port):
        s=socket(AF_INET,SOCK_STREAM)
        s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
        s.bind((server_ip,port))
        s.listen(5)
        while True:
            conn,addr=s.accept()
            gevent.spawn(talk,conn,addr)
    
    def talk(conn,addr):
        try:
            while True:
                res=conn.recv(1024)
                print('client %s:%s msg: %s' %(addr[0],addr[1],res))
                conn.send(res.upper())
        except Exception as e:
            print(e)
        finally:
            conn.close()
    
    if __name__ == '__main__':
        server('127.0.0.1',8080)
    sever
    from socket import *
    
    client=socket(AF_INET,SOCK_STREAM)
    client.connect(('127.0.0.1',8080))
    
    
    while True:
        msg=input('>>: ').strip()
        if not msg:continue
    
        client.send(msg.encode('utf-8'))
        msg=client.recv(1024)
        print(msg.decode('utf-8'))
    client
    from threading import Thread
    from socket import *
    import threading
    
    def client(server_ip,port):
        c=socket(AF_INET,SOCK_STREAM) #套接字对象一定要加到函数内,即局部名称空间内,放在函数外则被所有线程共享,则大家公用一个套接字对象,那么客户端端口永远一样了
        c.connect((server_ip,port))
    
        count=0
        while True:
            c.send(('%s say hello %s' %(threading.current_thread().getName(),count)).encode('utf-8'))
            msg=c.recv(1024)
            print(msg.decode('utf-8'))
            count+=1
    if __name__ == '__main__':
        for i in range(500):
            t=Thread(target=client,args=('127.0.0.1',8080))
            t.start()
    多线程并发多个客户端

     

  • 相关阅读:
    top命令
    MySQL基准测试(三)--开源工具与实例演示
    MySQLdump之single-transaction详解
    牛刀小试MySQL--日志文件
    MySQL基准测试(二)--方法
    MySQL基准测试(一)--原因,策略,思路
    MySQL实验准备(二)--Python模拟数据(MySQL数据库)
    MySQL实验准备(一)--环境准备
    InnoDB存储引擎概览
    单机多实例mysq 8.0l部署安装
  • 原文地址:https://www.cnblogs.com/eternity-twinkle/p/10731953.html
Copyright © 2020-2023  润新知