• 多线程,生产者消费者模型


    1.生产者消费者模型

    模型就是解决某个问题的固定方法或套路

    1.1 要解决什么问题

    生产者: 泛指产生数据的一方

    消费者: 泛指处理数据的一方

    案例:

    ​ 食堂饭店是生产者

    ​ 我们吃饭的人就是消费者

    他们之间有什么问题

    ​ 效率低 因为双方的处理速度不同 一个快一个慢 则双方需要相互等待

    具体的解决方法:

    1.先将双方解开耦合,让不同的进程负责不同的任务

    2.提供一个共享的容器 来平衡双方的能力,之所用进程队列是因为队列 可以在进程间共享

    案例:

    from multiprocessing import Process,Queue
    import requests
    import re,os,time,random
    
    
    # 生产者任务
    def product(urls,q):
        i = 0
        for url in urls:
            response = requests.get(url)
            text = response.text
            # 将生产完成的数据放入队列中
            time.sleep(random.random())
            q.put(text)
            i += 1
            print(os.getpid(),"生产了第%s个数据" % i)
    
    
    def customer(q):
        i = 0
        while True:
            text = q.get()
            time.sleep(random.random())
            res = re.findall('src=//(.*?) width', text)
            i += 1
            print(" 第%s个任务获取到%s个img" % (i,len(res)))
    
            
    if __name__ == '__main__':
        urls = [
            "http://www.baidu.com",
            "http://www.baidu.com",
            "http://www.baidu.com",
            "http://www.baidu.com",
        ]
    
        # 创建一个双方能共享的容器
        q = Queue()
    
        # 生产者进程
        p1 = Process(target=product,args=(urls,q))
        p1.start()
    
    
        # 消费者进程
        c = Process(target=customer,args=(q,))
        c.start()
    

    问题: 消费不知道什么时候结束

    joinableQueue 继承自Queue 用法一致,

    增加了join 和taskDone

    join是个阻塞函数 会阻塞直到taskdone的调用次数等于 存入的元素个数 可以用于表示队列任务处理完成

    案例:

    from multiprocessing import Process,JoinableQueue
    import requests
    import re,os,time,random
    
    """
    生产者 负责生产热狗 
    消费者 负责吃热狗  
    
    
    """
    
    # 生产者任务
    def product(q,name):
        for i in range(5):
            dog = "%s的热狗%s" % (name,(i + 1))
            time.sleep(random.random())
            print("生产了",dog)
            q.put(dog)
    
    # 吃热狗
    def customer(q):
        while True:
            dog = q.get()
            time.sleep(random.random())
            print("消费了%s" % dog)
            q.task_done() # 标记这个任务处理完成
    
            
    if __name__ == '__main__':
    
        # 创建一个双方能共享的容器
        q = JoinableQueue()
    
        # 生产者进程
        p1 = Process(target=product,args=(q,"上海分店"))
        p2 = Process(target=product,args=(q,"北京分店"))
    
        p1.start()
        p2.start()
    
    
        # 消费者进程
        c = Process(target=customer,args=(q,))
        # c.daemon = True # 可以将消费者设置为守护进程 当主进程确认 任务全部完成时 可以随着主进程一起结束
        c.start()
    
    
        p1.join()
        p2.join()  # 代码走到这里意味着生产方完成
    
        q.join() # 意味着队列中的任务都处理完成了
    
        # 结束所有任务
        c.terminate() # 直接终止消费者进程
    
        # 如何判定今天的热狗真的吃完了
        # 1.确定生成者任务完成
        # 2.确定生出来的数据已经全部处理完成
    

    redis 消息队列

    MQ 消息队列

    常用来做流量削峰 保证服务不会因为高并发而崩溃

    2.多线程

    并发编程

    1.什么是线程

    回顾 进程是操作系统可以调度已经进行资源分配的基本单位,是一个资源单位,其中包含了运行这个程序所需的资源

    线程是操作系统可以运算调度的最小单位,是真正的执行单位,其包含在进程中, 一个线程就是一条固定的控制流程,

    一个进程可以包含多个线程,同一进程中的线程共享进程内的资源

    特点:系统会为每一个进程自动创建一条线程,称之为主线程, 后续通过代码开启的线程称之为子线程

    进程对比线程

    进程是一个资源单位 先是执行单位

    创建进程的开销远大于线程

    多个进程之间内存是相互隔离的 而线程是共享进程内的所有资源

    进程之间之间对于硬件资源是竞争关系 而线程是协作关系

    当然开启线程也是需要消耗资源的

    进程之间有层级关系 ,而线程之间没有是平等的

    比喻:

    ​ 计算机是工厂 进程是车间 线程是流水线

    为什么用线程

    1.有多个任务要并发处理

    2.当要并发处理的任务有很多的时,不能使用进程 进程资源开销太大 线程开销非常小 适用于任务数非常多的情况

    使用线程

    方式1 直接实例化Thread类

    from threading  import Thread
    
    # def task():
    #     print("子线程 run")
    #
    # # 与进程不同之处1   不需要加判断 开启线程的代码放哪里都可以
    # t = Thread(target=task)
    # t.start()
    # print("over")
    
    
    # 使用方法2  继承Thread类
    class MyThread(Thread):
    
        def run(self):
            # 把要在子线中执行的代码放入run中
            print("子 run")
    
    mt = MyThread()
    mt.start()
    print("over")
    

    线程安全问题

    只要并发访问了同一资源一定会产生安全问题 ,解决方案和多进程一致 就是给操作公共资源代码加锁

    from threading import  Thread,Lock
    import time
    a = 10
    
    l = Lock()
    
    def task():
        global a
        l.acquire()
        temp = a
        time.sleep(0.1)
        a = temp - 1
        l.release()
    
    ts = []
    for i in range(10):
        t = Thread(target=task)
        t.start()
        ts.append(t)
    for t in ts:t.join()
    
    print(a)
    

    守护线程

    一个线程a 设置为b的守护线程, a会随着b的结束而结束

    默认情况下 主线程即使代码执行完毕 也会等待所有非守护线程完毕后程序才能结束 因为多个线程之间是协作关系

    from threading import Thread
    import time
    
    
    # 妃子的一生
    def task():
        print("妃子 start")
        time.sleep(5)
        print("妃子 over")
    
    def task2():
        print("皇太后 start")
        time.sleep(3)
        print("皇太后 over")
    
    
    # 皇帝的一生
    print("主 start")
    
    t = Thread(target=task)
    t.daemon = True
    t.start()
    
    t2 = Thread(target=task2)
    t2.start()
    
    print("主 over")
    
    
    """结果
    主 start 
    妃子start 
    皇太后 start 
    主over 
    皇太后 over
    
    """
    

    线程中的常用属性和方法

    from threading import  Thread,currentThread,enumerate,activeCount
    import time
    
    # t = Thread()
    # t.start()
    # t.join()
    # t.is_alive()
    # t.isAlive()
    # t.ident  # 线程标识符   id
    # t.daemon
    
    # 获取当前线程对象
    # print(currentThread())
    # t = Thread(target=lambda :print(currentThread()))
    # t.start()
    
    t = Thread(target=lambda :time.sleep(1))
    t.start()
    
    t = Thread(target=lambda :time.sleep(1))
    t.start()
    t.join()
    # 获取正在运行的所有线程对象  是一个列表
    print(enumerate())
    
    # 存活的线程数量
    print(activeCount())
    

    死锁现象

    递归所

    信号量

    2.多线程

    什么是线程

    与进程的区别

    如何使用 两种方式

    守护线程

    常用属性

    线程安全问题

    一堆锁

    互斥锁 死锁现象 Rlock递归锁 型号量

  • 相关阅读:

    双向链表和环形链表(约瑟夫问题)
    单向链表的增删查改
    稀疏数组与环形数组
    离焦事件。这个坑谁抗的住呀,好无语呀
    maven
    maven工程运行出Unable to compile class for JSP: 错误
    笔记-JavaWeb学习之旅19
    获取redis cluster master对应的slot分布情况
    批量获取mysql数据库实例指定参数的值
  • 原文地址:https://www.cnblogs.com/bladecheng/p/11132242.html
Copyright © 2020-2023  润新知