一、线程(IO密集型工作多线程有用)
- 线程:
- 概述:
- 若一个文件从上到下顺序执行,则为串行执行,整个py文件实际上是一个主线程
- 若多线程,则可以并行执行,同一个时刻可以运行多个代码段
- 给每个client请求分配一个线程,则这些线程可以同时工作
- 多线程、多进程:
- 1、一个应用程序,可以有多进程和多线程;默认是单进程、单线程
- 2、单进程、多线程 :
- 多线程:IO操作(输入输出流,文件操作)有用,因为几乎不用cpu来调度,一般用多线程来提高并发
- 计算型操作,需要用到cpu调度执行,一般用多进程提高并发
- 3、GIL 全局解释器锁,即进程中同一时刻只能被CPU 调度一个线程
- 创建方式
- 创建方式一:常规方式,比较简单常用
import threadingdef func1(arg):print(arg)# t = threading.Thread( target=线程要执行的函数, args=函数参数-数组, kwargs=函数参数-字典)t = threading.Thread(target=f1, args=(123,) )t.start()# 准备就绪,准备让cpu进行调度,# 只要cpu一旦调度了该线程,就会执行threading 模块中的run方法,run方法只做一件事,执行target指向的函数# 即,target实际上是run在方法内部执行的
- 创建方式二: 重写init和run
class MyThread(threading.Thread):def __init__(self, func, args):self.func = funcself.args = argssuper(MyThread, self).__init__()def run(self):self.func(self.args)def f2():passobj = MyThread(f2, 123)obj.start()
- 常用方法:
- t.start()
- 准备好该线程,等待CPU进行调度,
- 虽然线程已经就绪,但是什么时候执行 谁也不知道,只有被cpu进行调度的时候才会执行
- t.join(3)
- 逐个执行线程,执行完毕后再往下执行;可设置执行“超时时间”,该方法使得多线程没有意义
- 主线程代码执行到这里,会等待子线程去执行,等待超时时间为3秒,子线程执行完毕,主线程才会继续往下执行
- t.setDaemon(True)
- 设置为后台进程(默认为False),主线程执行过程中,后台线程也在执行,主线程执行完毕,后台线程立即终止
二、线程锁
- 概述:
- 线程锁:
- 因为线程是随机调度,即可能并行去更“改同一个数据”,若多个线程同时对资源进行修改,则会发生错误
- 互斥锁,同一时刻,只允许一个线程来执行的操作
- 未使用“锁”:
- 10个人进行购买商品,每个人购买后商品减1,每个人看到的结果应该为9876543210
- 实际执行,所有人同时购买商品,同时修改NUM,同时输出NUM ,则都输出0
import threadingimport time
NUM = 0def function1():global NUMNUM += 1time.sleep(0.1) # 需要让所有线程都夯在这里,然后同时输出print(NUM)
for x in range(10):t = threading.Thread(target=function1, )t.start()
- 各种锁讲解
- “Rlock 锁”:
- 将数据修改的位置作为原子操作,加锁
import threadingimport time
NUM = 0lock = threading.RLock()
def function1():lock.acquire()global NUMNUM += 1time.sleep(2)print(NUM)lock.release()
for x in range(10):t = threading.Thread(target=function1,)t.start()
- 注意:lock = threading.Rlock() # 支持多层锁的嵌套,一般用Rlock,lock不支持
def func(l):global NUMl.acquire()NUM -= 1l.acquire()time.sleep(2)l.release()print(NUM)l.release()
- “semaphore”锁
- 信号量:表示同一时刻允许有多个线程同时工作,比如火车站过安检,每次允许10个人,上批次安检完成后再来十个人
- 注意:若同一批次运行的线程,都修改同一个数据,依然会有“数据错误”的情况,这里只是演示功能
import threadingimport time
NUM = 0semaphore = threading.BoundedSemaphore(5) # 表示每批放进来5个线程
def function1(i, se):se.acquire()global NUMNUM += 1time.sleep(2)print('我是线程:{}, NUM此时为:{}'.format(i, NUM))se.release()
for x in range(10):t = threading.Thread(target=function1, args=(x, semaphore))t.start()
- “event”锁:
- 事件:要锁全部锁,要放全部放,实则内部维护了一个变量,值为布尔值
- 该锁提供了3个方法:
- set() # 将Flag 值设为True
- clear() # 将Flag 值设为 False
- wait() # 若Flag为False,则阻塞住;若为True则放行
import threadingevent = threading.Event()
def function(id, en):print('兵{}:大王,怎么办?'.format(id))en.wait()print('兵{}:杀呀~~~'.format(id))
for x in range(10):t = threading.Thread(target=function, args=(x, event))t.start()
event.clear()print('1、杀出一条血路 2、投降')you_choice = input('>>').strip()if you_choice == '1':event.set()
- "condition" 锁
- 使得线程等待,只有当满足条件时,才放出N个线程去执行任务
- 注意,wait和notify方法前后,必须被acquire和release方法包起来
- 姿势1:自行notify 通知运行N个
import threadingcondition = threading.Condition()
def function(id, con):con.acquire()con.wait() # 子线程全部卡在这里,等待通知print('兵{}:杀呀~~~'.format(id))con.release()
for x in range(100):t = threading.Thread(target=function, args=(x, condition))t.start()
print('你要挑战几个?')you_choice = input('>>').strip()condition.acquire()condition.notify(int(you_choice)) # 传进去几个,上面运行几个线程condition.release()
- 姿势2:条件成立,则放出一个去运行
import threadingdef condition_func(): # 该函数返回值必须为布尔值ret = Falseinp = input('>>').strip()if inp == '1':ret = Truereturn ret
def function(id, con):con.acquire()con.wait_for(condition_func) # 一旦该函数体返回值为True,则放出一个线程print('thread{}:im gone~~~'.format(id))con.release()
condition = threading.Condition()for x in range(5):t = threading.Thread(target=function, args=(x, condition))t.start()
三、Timeer 定时器:
- 定时器,指定n秒后执行某操作
from threading import Timerimport timedef function():print('开火~')t = Timer(3, function) # 子线程,三秒后执行该函数t.start()for i in range(1, 4):print('time:{}'.format(i)) # 主线程,数数,每次间隔1秒time.sleep(1)
四、线程池:
- 线程池概述:
- “线程池”与“上下文切换”:
- CPU调度线程,当时间片用完,会进行切换,每次切换时线程现场的“保存与载入”都是时间开销
- 当线程数目达到一个峰值后,再多创建线程,执行效率会下降
- 因此,应该控制线程创建的最大数目,池中线程取一个少一个,无线程时,后续请求等待;执行完毕归还线程
- 要创建一个线程池,那么该线程池应满足如下条件:
- 线程池为一个容器
- 池中线程用一个少一个
- 池中无线程,则进行等待
- 线程执行完任务,则进行归还
- 创建姿势1: 利用队列来存放“线程”
import timeimport queueimport threading
class MyPool:def __init__(self, maxsize=5):self.maxsize = maxsizeself._q = queue.Queue(self.maxsize) # 创建一个指定大小的队列for _ in range(self.maxsize):self._q.put(threading.Thread) # 在队列中全为线程"类"
def get_thread(self):return self._q.get() # 取出一个线程"类"
def add_thread(self):self._q.put(threading.Thread) # 添加一个线程“类”
# 定义任务,参数为线程池(执行该任务的线程来源),执行完毕后向该池中归还(添加)一个线程def task(n, p):print('{}: 执行任务,完毕'.format(n))time.sleep(2)p.add_thread()
# 创建一个大小为5的线程池pool = MyPool(5)
for i in range(100):t_class = pool.get_thread() # 从队列中获取一个线程"类名称"t_obj = t_class(target=task, args=(i, pool)) # 用取出来的类,实例化个线程,并交给线程任务去执行,每次从队列中取一个线程,若没有线程则等待t_obj.start()
- 此时,每次有5个线程去处理工作,不会超过5
- 问题:
- 线程重用:任务执行完成后归还线程,用的是“重新创建一个线程并put进队列”的方法,即原来的线程还放于内存中等待被GC回收
- 空闲线程:若任务数少于池数目,则会多余创建,即应该线程池最初是空的,来一个创建一个,最大为5
姿势2:
- 队列中存放任务:
- 往往每个任务都是一个函数,
- 可以将任务和其相关参数搞成元组(函数名,参数),将这些元组put到队列中,则队列中保存的全是需要执行的任务
- 创建N个线程(N为线程池大小):
- 每个线程都“循环”从队列中get任务并执行(线程重用)
- 若队列中所有任务都取完了,则终止已经创建的线程,终止方法如下:
- get方法有超时时间,可以设置超时时间,超过这个时间则线程自动销毁
- 在队列末尾插入几个空值,get后判断,若取到的是任务则执行,否则则终止
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import queue
import threading
import contextlib
import time
StopEvent = object() # 创建个静态字段,字段任何值都行,相当于None,即要在队列后插入的空值
class ThreadPool(object):
def __init__(self, max_num, max_task_num = None):
# 创建任务队列,可显示指定任务队列大小,否则为不限制
if max_task_num:
self.q = queue.Queue(max_task_num)
else:
self.q = queue.Queue()
self.max_num = max_num # 最大线程数
self.cancel = False
self.terminal = False
self.generate_list = [] # 当前已经创建的线程
self.free_list = [] # 当前的空闲线程,队列中没有任务,则线程会空闲
def run(self, func, args, callback=None):
"""
线程池执行一个任务
:param func: 任务函数
:param args: 任务函数所需参数
:param callback: 任务执行失败或成功后执行的回调函数,回调函数有两个参数1、任务函数执行状态;2、任务函数返回值(默认为None,即:不执行回调函数)
:return: 如果线程池已经终止,则返回True否则None
"""
if self.cancel:
return
# 没有空闲着的线程,并且已经创建的线程有没有超过线程池最大大小时,创建线程
if len(self.free_list) == 0 and len(self.generate_list) < self.max_num:
self.generate_thread()
w = (func, args, callback,) # 将线程的id,要执行的任务,包装成一个元组
self.q.put(w) # 将包装好的元组放入队列中
def generate_thread(self):
"""
创建一个线程,并执行call方法
"""
t = threading.Thread(target=self.call)
t.start()
def call(self):
"""
循环去获取任务函数并执行任务函数
"""
current_thread = threading.currentThread() # 获取当前线程
self.generate_list.append(current_thread) # 在线程列表中添加一个线程,
event = self.q.get() #从队列中获取任务,任务都是包装的元组(id,任务)
# 若是一个元组,即不等于stopevent
while event != StopEvent:
func, arguments, callback = event # 元组解包
try:
result = func(*arguments) # 执行任务
success = True
except Exception as e:
success = False
result = None
if callback is not None:
try:
callback(success, result)
except Exception as e:
pass
# 线程执行完任务,则线程处于空闲状态,则标记该任务为空闲进程,下次直接会从空闲进程去取任务
with self.worker_state(self.free_list, current_thread):
if self.terminal:
event = StopEvent
else:
event = self.q.get() # 执行完任务后,该线程又去获取任务,然后再次while
# 若evnent不是一个元组,则从线程列表中移除当前线程
else:
self.generate_list.remove(current_thread)
def close(self):
"""
执行完所有的任务后,所有线程停止,创建了几个线程,则往任务队列中插入几个空值
"""
self.cancel = True
full_size = len(self.generate_list)
while full_size:
self.q.put(StopEvent)
full_size -= 1
def terminate(self):
"""
无论是否还有任务,终止线程
"""
self.terminal = True
while self.generate_list:
self.q.put(StopEvent)
self.q.queue.clear()
@contextlib.contextmanager
def worker_state(self, state_list, worker_thread):
"""
用于记录线程中正在等待的线程数
"""
state_list.append(worker_thread)
try:
yield
finally:
state_list.remove(worker_thread)
# How to use
pool = ThreadPool(5)
def callback(status, result):
# 需要执行的任务
pass
def action(i):
print(i)
# 创建300个任务
for i in range(300):
ret = pool.run(action, (i,), callback)
time.sleep(5)
print(len(pool.generate_list), len(pool.free_list))
print(len(pool.generate_list), len(pool.free_list))
# pool.close()
# pool.terminate()