• Python异步IO之协程(二):使用asyncio的不同方法实现协程


    引言:在上一章中我们介绍了从yield from的来源到async的使用,并在最后以asyncio.wait()方法实现协程,下面我们通过不同控制结构来实现协程,让我们一起来看看他们的不同作用吧~

    在多个协程中的线性控制流很容易通过内置的关键词await来管理。使用asyncio模块中的方法可以实现更多复杂的结构,它可以并发地完成多个协程。

    一、asyncio.wait()

    你可以将一个操作分成多个部分并分开执行,而wait(tasks)可以被用于中断任务集合(tasks)中的某个被事件循环轮询到的任务,直到该协程的其他后台操作完成才被唤醒

    import time
    import asyncio
    async def taskIO_1():
        print('开始运行IO任务1...')
        await asyncio.sleep(2)  # 假设该任务耗时2s
        print('IO任务1已完成,耗时2s')
        return taskIO_1.__name__
    async def taskIO_2():
        print('开始运行IO任务2...')
        await asyncio.sleep(3)  # 假设该任务耗时3s
        print('IO任务2已完成,耗时3s')
        return taskIO_2.__name__
    async def main(): # 调用方
        tasks = [taskIO_1(), taskIO_2()]  # 把所有任务添加到task中
        done,pending = await asyncio.wait(tasks) # 子生成器
        for r in done: # done和pending都是一个任务,所以返回结果需要逐个调用result()
            print('协程无序返回值:'+r.result())
    
    if __name__ == '__main__':
        start = time.time()
        loop = asyncio.get_event_loop() # 创建一个事件循环对象loop
        try:
            loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束
        finally:
            loop.close() # 结束事件循环
        print('所有IO任务总耗时%.5f秒' % float(time.time()-start))

    执行结果如下:

    开始运行IO任务1...
    开始运行IO任务2...
    IO任务1已完成,耗时2s
    IO任务2已完成,耗时3s
    协程无序返回值:taskIO_2
    协程无序返回值:taskIO_1
    所有IO任务总耗时3.00209秒

    【解释】:wait()官方文档用法如下:

    done, pending = await asyncio.wait(aws)

    此处并发运行传入的aws(awaitable objects),同时通过await返回一个包含(done, pending)的元组,done表示已完成的任务列表pending表示未完成的任务列表
    注:
    ①只有当给wait()传入timeout参数时才有可能产生pending列表。
    ②通过wait()返回的结果集按照事件循环中的任务完成顺序排列的,所以其往往和原始任务顺序不同

    二、asyncio.gather()

    如果你只关心协程并发运行后的结果集合,可以使用gather(),它不仅通过await返回仅一个结果集,而且这个结果集的结果顺序是传入任务的原始顺序

    import time
    import asyncio
    async def taskIO_1():
        print('开始运行IO任务1...')
        await asyncio.sleep(3)  # 假设该任务耗时3s
        print('IO任务1已完成,耗时3s')
        return taskIO_1.__name__
    async def taskIO_2():
        print('开始运行IO任务2...')
        await asyncio.sleep(2)  # 假设该任务耗时2s
        print('IO任务2已完成,耗时2s')
        return taskIO_2.__name__
    async def main(): # 调用方
        resualts = await asyncio.gather(taskIO_1(), taskIO_2()) # 子生成器
        print(resualts)
    
    if __name__ == '__main__':
        start = time.time()
        loop = asyncio.get_event_loop() # 创建一个事件循环对象loop
        try:
            loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束
        finally:
            loop.close() # 结束事件循环
        print('所有IO任务总耗时%.5f秒' % float(time.time()-start))

    执行结果如下:

    开始运行IO任务2...
    开始运行IO任务1...
    IO任务2已完成,耗时2s
    IO任务1已完成,耗时3s
    ['taskIO_1', 'taskIO_2']
    所有IO任务总耗时3.00184秒

    【解释】:gather()通过await直接返回一个结果集列表,我们可以清晰的从执行结果看出来,虽然任务2是先完成的,但最后返回的结果集的顺序是按照初始传入的任务顺序排的

    三、asyncio.as_completed()

    as_completed(tasks)是一个生成器,它管理着一个协程列表(此处是传入的tasks)的运行。当任务集合中的某个任务率先执行完毕时,会率先通过await关键字返回该任务结果。可见其返回结果的顺序和wait()一样,均是按照完成任务顺序排列的。

    import time
    import asyncio
    async def taskIO_1():
        print('开始运行IO任务1...')
        await asyncio.sleep(3)  # 假设该任务耗时3s
        print('IO任务1已完成,耗时3s')
        return taskIO_1.__name__
    async def taskIO_2():
        print('开始运行IO任务2...')
        await asyncio.sleep(2)  # 假设该任务耗时2s
        print('IO任务2已完成,耗时2s')
        return taskIO_2.__name__
    async def main(): # 调用方
        tasks = [taskIO_1(), taskIO_2()]  # 把所有任务添加到task中
        for completed_task in asyncio.as_completed(tasks):
            resualt = await completed_task # 子生成器
            print('协程无序返回值:'+resualt)
    
    if __name__ == '__main__':
        start = time.time()
        loop = asyncio.get_event_loop() # 创建一个事件循环对象loop
        try:
            loop.run_until_complete(main()) # 完成事件循环,直到最后一个任务结束
        finally:
            loop.close() # 结束事件循环
        print('所有IO任务总耗时%.5f秒' % float(time.time()-start))

    执行结果如下:

    开始运行IO任务2...
    开始运行IO任务1...
    IO任务2已完成,耗时2s
    协程无序返回值:taskIO_2
    IO任务1已完成,耗时3s
    协程无序返回值:taskIO_1
    所有IO任务总耗时3.00300秒

    【解释】:从上面的程序可以看出,使用as_completed(tasks)wait(tasks)相同之处是返回结果的顺序是协程的完成顺序,这与gather()恰好相反。而不同之处as_completed(tasks)可以实时返回当前完成的结果,而wait(tasks)需要等待所有协程结束后返回的done去获得结果。

    四、总结

    以下aws指:awaitable objects。即可等待对象集合,如一个协程是一个可等待对象,一个装有多个协程的列表是一个aws

    asyncio 主要传参 返回值顺序 await返回值类型 函数返回值类型
    wait() aws 协程完成顺序

    (done,pending)

    装有两个任务列表元组

    coroutine
    as_completed() aws 协程完成顺序 原始返回值 迭代器
    gather() *aws 传参任务顺序 返回值列表 awaitable

     【参考文献】:

    [1] Composing Coroutines with Control Structures

    [2] Python 3.7.2文档.协程与任务

    [3] 控制组合式 Coroutines

  • 相关阅读:
    C++中的句柄类
    普林斯顿大学算法课 Algorithm Part I Week 3 自我总结
    普林斯顿大学算法课 Algorithm Part I Week 3 排序的应用 System Sorts
    普林斯顿大学算法课 Algorithm Part I Week 3 重复元素排序
    普林斯顿大学算法课 Algorithm Part I Week 3 求第K大数 Selection
    普林斯顿大学算法课 Algorithm Part I Week 3 快速排序 Quicksort
    普林斯顿大学算法课 Algorithm Part I Week 3 排序稳定性 Stability
    普林斯顿大学算法课 Algorithm Part I Week 3 比较器 Comparators
    普林斯顿大学算法课 Algorithm Part I Week 3 排序算法复杂度 Sorting Complexity
    普林斯顿大学算法课 Algorithm Part I Week 3 归并排序 Mergesort
  • 原文地址:https://www.cnblogs.com/liugp/p/11074586.html
Copyright © 2020-2023  润新知