在socket的通信中,recv,accept,recvfrom(UDP协议接收信息)这些阶段由于需要收到信息,才能继续下面的代码,所以这些阶段叫做阻塞,类似于
我们python变成中的input函数,time.sleep方法,在socket通信中,这些阻塞会使进程进入到阻塞状态,下次再进入运行状态时要消耗内存,所以解决
阻塞可以提高我们代码的执行效率和节省内存空间。下面以访问文件为例,看几种典型的IO模式
一、阻塞IO
经历了两个阻塞阶段
1.发送方:发出去的请求之后等待回应
2.接收方:收到请求,整理数据,从内核拷贝到进程里
这是最原始的IOmodel,记住这两个阻塞阶段,后面的IO模型都是基于这两点做该进的。
当然,我们可以开起多线程,多进程的方式,在阻塞的时间里处理其他的事情,但是当线程、进程开到很多的时候会占用系统资源,降低系统响应速率。
当规模比较大时,这种方法就不适合选择了。
二、非阻塞IO
import socket sk = socket.socket() sk.bind(('127.0.0.1',9000)) sk.setblocking(False) sk.listen() conn_l = [] # 已连接的客户端列表 del_conn = [] while True: try: conn,addr = sk.accept() #不阻塞,但是没人连我会报错 print('建立连接了:',addr) conn_l.append(conn) #将连接过的加入列表,便于提取下次客户端第二次发送信息 except BlockingIOError: for con in conn_l: try: msg = con.recv(1024) # 非阻塞,如果没有数据就报错 if msg == b'': del_conn.append(con) continue print(msg) con.send(b'byebye') except BlockingIOError:pass for con in del_conn: con.close() conn_l.remove(con) del_conn.clear()
import time import socket from threading import Thread def func(): sk = socket.socket() sk.connect(('127.0.0.1',8080)) time.sleep(0.1) # 模拟阻塞 sk.send(b'hello') time.sleep(0.5) # 模拟接收消息过程 msg = sk.recv(1024) print(msg) sk.close() for i in range(10): t = Thread(target=func) t.start()
依次启动服务端,客户端 服务端
收到客户端连接并加入conn_l列表,由于客户端设置了一个发消息之前设置了一个sleep,并且服务端set.blocking=False,
服务端while循环时未取到accept会进入注释为‘1’的异常处理,查询conn_1后,接收到客户端完成sleep发来的信息。但此时会接收到一系列的
b'',(同时未取到信息会报错,捕捉并且不作处理)因为客户端已经发送完成,没有消息了,服务端recv都是空,应该判断msg是否为b'',
并将这个连接加入到删除列表,循环完成后删除。
但是用while轮询时,非常占用内存,导致系统处理变慢,响应速率降低。
三、IO多路复用
IO多路复用模型是socket服务端借助了操作系统来完成的,操作系统会监听访问者,一旦收到连接请求,操作系统来给socket服务端提供信号,让其进入accept阶段,向下继续执行,使其变为非阻塞状态,同时也会将文件拷贝至进程,让其recv。这种用于socket端比较多的情况,因为比起阻塞IO,多路复用增加了一个系统与socket之间的相互通信。但是如果监听的socket较多的话,效率还是很快的。
import select # select模块是操作系统用来监听的模块 import socket sk = socket.socket() sk.bind(('127.0.0.1',8000)) sk.setblocking(False) sk.listen() read_lst = [sk] # 将需要监听的sk加入列表 while True: # [sk,conn] r_lst,w_lst,x_lst = select.select(read_lst,[],[]) # 返回的是三个值,分别为是哪个socket可读,可写,可改 # 一旦有文件可以读取,就会返回该socket的地址 for i in r_lst: if i is sk: conn,addr = i.accept() read_lst.append(conn) # socket可连接的客户端链接地址 else: ret = i.recv(1024) if ret == b'': i.close() read_lst.remove(i) continue print(ret) i.send(b'goodbye!')
相较于非阻塞IO,可以监听多个socket,并且不用多次轮询,优化了内存使用
补充一点,代码中的select是windows系统用的,还有Linux的poll模块,监听的数量要比select多,以及Linux的epolled模块,不仅起到监听socket对象的作用,而且还会给每个对象加上一个回调函数。windows中的selector模块和其作用相似。
在监听的对象成百上千时,由于数据类型是列表,数量越多查询速度越慢,但是使用epoll一旦准备好可以读取,可以调用它的回调函数直接来发送信号给socket,速率更高。
四、异步IO
异步IO原理是 用户端发送读取请求,不进入阻塞,可以做不相干的业务逻辑,将请求发给操作系统执行,操作系统完成文件的recv和提取到进程的过程,用户端直接读取。
但由于python端没有可以直接操作系统的接口,所以目前大部分异步IO都是由C语言完成。