• 生产者消费者模型


    生产者消费者模型

    模型就是解决某个问题的固定方法或套路

    生产者:泛指产生数据的一方

    消费者:泛指处理数据的一方

    用来解决什么问题

    • 案例
      • 食堂饭店就是生产者
      • 我们就是消费者

    假设厨师只有一个盘子,那么在他做菜的时候,我们就需要等,而我们吃饭的时候,他也需要等

    导致效率低,双方相互等待,因为双方的效率不一致

    具体的解决方案:

    1. 先将双方的耦合解开,让不同的进程去负责不同的任务
    2. 提供一个共享的容器,来平衡双方的能力,双方只要使用这个容器就可以了。推荐使用队列,因为队列可以在进程间共享内存

    例如:

    from multiprocessing import Process, Queue
    import requests, re, time, random, os
    
    def product(urls, q):
        '''生产者,爬取数据'''
        for ind, url in enumerate(urls):
            response = requests.get(url)
            response.encoding = response.apparent_encoding
            q.put(response.text)
            print(f'第{ind+1}个网站,爬取状态为{response.status_code},进程编号{os.getpid()}')
    
    
    def customer(q):
        '''消费者,处理数据'''
        i = 0
        while True:
            text = q.get()
            time.sleep(random.random())
            res = re.findall('src=//(.*?) width', text)
            i += 1
            print("第%s个任务获取到%s个img%s个编码信息" % (i, len(res), len(text)))
    
    
    if __name__ == '__main__':
        urls = [
            'http://www.baidu.com',
            'http://www.jd.com',
            'http://www.taobao.com',
        ]
        q = Queue()
        p = Process(target=product, args=(urls, q))
        p.start()
    
        c = Process(target=customer, args=(q,))
        c.start()
    
    
    第1个网站,爬取状态为200,进程编号1672
    第1个任务获取到1个img2287个编码信息
    第2个网站,爬取状态为200,进程编号1672
    第2个任务获取到0个img90221个编码信息
    第3个网站,爬取状态为200,进程编号1672
    第3个任务获取到0个img141513个编码信息
    ...
    

    但是这样做有一个问题,消费者不知道什么时候结束

    如果生产者只有一个,那么可以在生产结束后往q中put一个None,作为生产结束的标识,但是但生产者有多个的时候,这种方法就不可行了

    JoinableQueue

    • 继承自Queue,用法一致
    • 新增了join(等待) 和task_done(任务完成)

    其中join是一个阻塞函数,会一直阻塞到task_done的调用次数等于存入元素的个数才会释放,用于表示队列任务处理完成

    案例:

    from multiprocessing import Process, JoinableQueue
    import time, random
     '''如何判定今天的热狗真的吃完了
     	1.确定生成者任务完成
     	2.确定生出来的数据已经全部处理完成'''
    
    # 生产热狗
    def product(q, name):
        for i in range(3):
            dog = f"{name}的热狗{i + 1}"
            time.sleep(random.random())
            print("生产了", dog)
            q.put(dog)
    
    
    # 吃热狗
    def customer(q):
        while True:
            dog = q.get()
            time.sleep(random.random())
            print("消费了%s" % dog)
            q.task_done()  # 标记这个任务处理完成
    
    
    if __name__ == '__main__':
        # 创建一个双方能共享的容器
        q = JoinableQueue()
    
        # 生产者进程
        p1 = Process(target=product, args=(q, "上海分店"))
        p2 = Process(target=product, args=(q, "北京分店"))
    
        p1.start()
        p2.start()
    
        # 消费者进程
        c = Process(target=customer, args=(q,))
        c.daemon = True # 将消费者设置为守护进程 当主进程确认 任务全部完成时 可以随着主进程一起结束
        c.start()
    	
        p1.join()
        p2.join()  # 代码走到这里意味着生产方完成 
    
        q.join()  # 意味着队列中的任务都处理完成了
    
        # c.terminate()  # 也可以直接终止消费者进程
       
    

    各种各样的队列(如redis消息队列,MQ消息队列)都是典型的消费者生产者模型。

    主要用于流量的削峰,保证服务器不会因为高并发而崩溃

  • 相关阅读:
    netcore---Program.cs配置相关信息,及读取配置信息
    js
    python3 openssl问题(贼有用)
    Flask+微信公众号开发(接入指南)
    运维角度处理跨域问题
    羞羞的Python模块包
    Nginx之伪404( root与alias )
    【深度学习】:梯度下降,随机梯度下降(SGD),和mini-batch梯度下降
    【深度学习】:小白也能看懂的卷积神经网络
    《剑指offer》5:替换空格
  • 原文地址:https://www.cnblogs.com/lucky75/p/11134837.html
Copyright © 2020-2023  润新知