Python学习【第24篇】：死锁，递归锁，信号量，Event事件，线程Queue

一、死锁现象与递归锁

进程也是有死锁的

所谓死锁：是指两个或两个以上的进程或线程在执行过程中，因争夺资源而造成的一种互相等待的现象，若无外力作用，

它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁，这些永远在互相等待的进程称为死锁进程，

如下就是死锁

 1 死锁-------------------
 2 from  threading import Thread,Lock,RLock
 3 import time
 4 mutexA = Lock()
 5 mutexB = Lock()
 6 class MyThread(Thread):
 7     def run(self):
 8         self.f1()
 9         self.f2()
10     def f1(self):
11         mutexA.acquire()
12         print('33[33m%s 拿到A锁 '%self.name)
13         mutexB.acquire()
14         print('33[45%s 拿到B锁 '%self.name)
15         mutexB.release()
16         mutexA.release()
17     def f2(self):
18         mutexB.acquire()
19         print('33[33%s 拿到B锁 ' % self.name)
20         time.sleep(1)  #睡一秒就是为了保证A锁已经被别人那到了
21         mutexA.acquire()
22         print('33[45m%s 拿到B锁 ' % self.name)
23         mutexA.release()
24         mutexB.release()
25 if __name__ == '__main__':
26     for i in range(10):
27         t = MyThread()
28         t.start() #一开启就会去调用run方法

那么怎么解决死锁现象呢？

解决方法，递归锁：在Python中为了支持在同一线程中多次请求同一资源，python提供了可重入锁RLock。

这个RLock内部维护着一个Lock和一个counter变量，counter记录了acquire的次数，从而使得资源可以被多次require。

直到一个线程所有的acquire都被release，其他的线程才能获得资源。上面的例子如果使用RLock代替Lock，则不会发生死锁

1	`mutexA=mutexB=threading.RLock()` `#一个线程拿到锁，counter加1,该线程内又碰到加锁的情况，<br>则counter继续加1，这期间所有其他线程都只能等待，等待该线程释放所有锁，即counter递减到0为止`

 1 # 2.解决死锁的方法--------------递归锁
 2 from  threading import Thread,Lock,RLock
 3 import time
 4 mutexB = mutexA = RLock()
 5 class MyThread(Thread):
 6     def run(self):
 7         self.f1()
 8         self.f2()
 9     def f1(self):
10         mutexA.acquire()
11         print('33[33m%s 拿到A锁 '%self.name)
12         mutexB.acquire()
13         print('33[45%s 拿到B锁 '%self.name)
14         mutexB.release()
15         mutexA.release()
16     def f2(self):
17         mutexB.acquire()
18         print('33[33%s 拿到B锁 ' % self.name)
19         time.sleep(1)  #睡一秒就是为了保证A锁已经被别人拿到了
20         mutexA.acquire()
21         print('33[45m%s 拿到B锁 ' % self.name)
22         mutexA.release()
23         mutexB.release()
24 if __name__ == '__main__':
25     for i in range(10):
26         t = MyThread()
27         t.start() #一开启就会去调用run方法

二、信号量Semaphore（其实也是一把锁）

Semaphore管理一个内置的计数器

Semaphore与进程池看起来类似，但是是完全不同的概念。

进程池：Pool(4)，最大只能产生四个进程，而且从头到尾都只是这四个进程，不会产生新的。

信号量：信号量是产生的一堆进程/线程，即产生了多个任务都去抢那一把锁

 1 from threading import Thread,Semaphore,currentThread
 2 import time,random
 3 sm = Semaphore(5) #运行的时候有5个人
 4 def task():
 5     sm.acquire()
 6     print('33[42m %s上厕所'%currentThread().getName())
 7     time.sleep(random.randint(1,3))
 8     print('33[31m %s上完厕所走了'%currentThread().getName())
 9     sm.release()
10 if __name__ == '__main__':
11     for i in range(20):  #开了10个线程 ，这20人都要上厕所
12         t = Thread(target=task)
13         t.start()

 1 hread-1上厕所
 2  Thread-2上厕所
 3  Thread-3上厕所
 4  Thread-4上厕所
 5  Thread-5上厕所
 6  Thread-3上完厕所走了
 7  Thread-6上厕所
 8  Thread-1上完厕所走了
 9  Thread-7上厕所
10  Thread-2上完厕所走了
11  Thread-8上厕所
12  Thread-6上完厕所走了
13  Thread-5上完厕所走了
14  Thread-4上完厕所走了
15  Thread-9上厕所
16  Thread-10上厕所
17  Thread-11上厕所
18  Thread-9上完厕所走了
19  Thread-12上厕所
20  Thread-7上完厕所走了
21  Thread-13上厕所
22  Thread-10上完厕所走了
23  Thread-8上完厕所走了
24  Thread-14上厕所
25  Thread-15上厕所
26  Thread-12上完厕所走了
27  Thread-11上完厕所走了
28  Thread-16上厕所
29  Thread-17上厕所
30  Thread-14上完厕所走了
31  Thread-15上完厕所走了
32  Thread-17上完厕所走了
33  Thread-18上厕所
34  Thread-19上厕所
35  Thread-20上厕所
36  Thread-13上完厕所走了
37  Thread-20上完厕所走了
38  Thread-16上完厕所走了
39  Thread-18上完厕所走了
40  Thread-19上完厕所走了

三、Event

线程的一个关键特性是每个线程都是独立运行且状态不可预测。如果程序中的其他线程需要通过判断某个线程的状态来确定自己下一步的操作,这时线程同步问题就会变得非常棘手。为了解决这些问题,我们需要使用threading库中的Event对象。对象包含一个可由线程设置的信号标志,它允许线程等待某些事件的发生。在初始情况下,Event对象中的信号标志被设置为假。如果有线程等待一个Event对象, 而这个Event对象的标志为假,那么这个线程将会被一直阻塞直至该标志为真。一个线程如果将一个Event对象的信号标志设置为真,它将唤醒所有等待这个Event对象的线程。如果一个线程等待一个已经被设置为真的Event对象,那么它将忽略这个事件, 继续执行

from threading import Event
Event.isSet() #返回event的状态值
Event.wait() #如果 event.isSet()==False将阻塞线程；
Event.set() #设置event的状态值为True，所有阻塞池的线程激活进入就绪状态， 等待操作系统调度；
Event.clear() #恢复

例如1.，有多个工作线程尝试链接MySQL，我们想要在链接前确保MySQL服务正常才让那些工作线程去连接MySQL服务器，如果连接不成功，都会去尝试重新连接。那么我们就可以采用threading.Event机制来协调各个工作线程的连接操作

 1 #首先定义两个函数，一个是连接数据库
 2 # 一个是检测数据库
 3 from threading import Thread,Event,currentThread
 4 import time
 5 e = Event()
 6 def conn_mysql():
 7     '''链接数据库'''
 8     count = 1
 9     while not e.is_set():  #当没有检测到时候
10         if count >3: #如果尝试次数大于3，就主动抛异常
11             raise ConnectionError('尝试链接的次数过多')
12         print('33[45m%s 第%s次尝试'%(currentThread(),count))
13         e.wait(timeout=1) #等待检测（里面的参数是超时1秒）
14         count+=1
15     print('33[44m%s 开始链接...'%(currentThread().getName()))
16 def check_mysql():
17     '''检测数据库'''
18     print('33[42m%s 检测mysql...' % (currentThread().getName()))
19     time.sleep(5)
20     e.set()
21 if __name__ == '__main__':
22     for i  in range(3):  #三个去链接
23         t = Thread(target=conn_mysql)
24         t.start()
25     t = Thread(target=check_mysql)
26     t.start()

2.例如2，红绿灯的例子

 1 from  threading import Thread,Event,currentThread
 2 import time
 3 e = Event()
 4 def traffic_lights():
 5     '''红绿灯'''
 6     time.sleep(5)
 7     e.set()
 8 def car():
 9     '''车'''
10     print('33[42m %s 等绿灯33[0m'%currentThread().getName())
11     e.wait()
12     print('33[44m %s 车开始通行' % currentThread().getName())
13 if __name__ == '__main__':
14     for i in range(10):
15         t = Thread(target=car)  #10辆车
16         t.start()
17     traffic_thread = Thread(target=traffic_lights)  #一个红绿灯
18     traffic_thread.start()

四、定时器（Timer）

指定n秒后执行某操作

from threading import Timer
def func(n):
    print('hello,world',n)
t = Timer(3,func,args=(123,))  #等待三秒后执行func函数，因为func函数有参数，那就再传一个参数进去
t.start()

五、线程queue

queue队列：使用import queue，用法与进程Queue一样

queue.Queue(maxsize=0) #先进先出

1 # 1.队列-----------
2 import queue
3 q = queue.Queue(3) #先进先出
4 q.put('first')
5 q.put('second')
6 q.put('third')
7 print(q.get())
8 print(q.get())
9 print(q.get())

queue.LifoQueue(maxsize=0)#先进后出

1 # 2.堆栈----------
2 q = queue.LifoQueue() #先进后出（或者后进先出）
3 q.put('first')
4 q.put('second')
5 q.put('third')
6 q.put('for')
7 print(q.get())
8 print(q.get())
9 print(q.get())

queue.PriorityQueue(maxsize=0) #存储数据时可设置优先级的队列

 1 # ----------------
 2 '''3.put进入一个元组，元组的第一个元素是优先级
 3 （通常也可以是数字，或者也可以是非数字之间的比较）
 4 数字越小，优先级越高'''
 5 q = queue.PriorityQueue()
 6 q.put((20,'a'))
 7 q.put((10,'b'))  #先出来的是b,数字越小优先级越高嘛
 8 q.put((30,'c'))
 9 print(q.get())
10 print(q.get())
11 print(q.get())

六、多线程性能测试

1.多核也就是多个CPU
（1）cpu越多，提高的是计算的性能
（2）如果程序是IO操作的时候（多核和单核是一样的），再多的cpu也没有意义。
2.实现并发
第一种：一个进程下，开多个线程
第二种：开多个进程
3.多进程：
   优点：可以利用多核
   缺点：开销大
4.多线程
   优点：开销小
   缺点：不可以利用多核
5多进程和多进程的应用场景
   1.计算密集型：也就是计算多，IO少
     如果是计算密集型，就用多进程（如金融分析等）
   2.IO密集型：也就是IO多，计算少
     如果是IO密集型的，就用多线程（一般遇到的都是IO密集型的）
下例子练习：

 1 # 计算密集型的要开启多进程
 2 from  multiprocessing import Process
 3 from threading import Thread
 4 import time
 5 def work():
 6     res = 0
 7     for i in range(10000000):
 8         res+=i
 9 if __name__ == '__main__':
10     l = []
11     start = time.time()
12     for i in range(4):
13         p = Process(target=work)  #1.9371106624603271  #可以利用多核（也就是多个cpu）
14         # p  = Thread(target=work)  #3.0401737689971924
15         l.append(p)
16         p.start()
17     for p in l:
18         p.join()
19     stop = time.time()
20     print('%s'%(stop-start))

 1 # I/O密集型要开启多线程
 2 from multiprocessing import Process
 3 from threading import Thread
 4 import time
 5 def work():
 6     time.sleep(3)
 7 if __name__ == '__main__':
 8     l = []
 9     start = time.time()
10     for i in range(400):
11         # p = Process(target=work)  #34.9549994468689   #因为开了好多进程，它的开销大，花费的时间也就长了
12         p = Thread(target=work) #2.2151265144348145  #当开了多个线程的时候，它的开销小，花费的时间也小了
13         l.append(p)
14         p.start()
15     for i in l :
16         i.join()
17     stop = time.time()
18     print('%s'%(stop-start))

七、python标准模块----concurrent.futures