Python全栈【socket网络编程】 |
本章内容:
- Socket
- 基于TCP的套接字
- 基于UDP的套接字
- TCP粘包
- SocketServer 模块(ThreadingTCPServer源码剖析)
Socket |
1、socket通常也称作"套接字"
用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。
socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)
socket和file的区别:
- file模块是针对某个指定文件进行【打开】【读写】【关闭】
- socket模块是针对 服务器端 和 客户端Socket 进行【打开】【读写】【关闭】
为何学习socket一定要先学习互联网协议:
1.首先:本节课程的目标就是教会你如何基于socket编程,来开发一款自己的C/S架构软件
2.其次:C/S架构的软件(软件属于应用层)是基于网络进行通信的
3.然后:网络的核心即一堆协议,协议即标准,你想开发一款基于网络通信的软件,就必须遵循这些标准。
2、socket层
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
所以,我们无需深入理解tcp/udp协议,socket已经为我们封装好了,我们只需要遵循socket的规定去编程,写出的程序自然就是遵循tcp/udp标准的。
3、套接字有两种(或者称为有两个种族),分别是基于文件型的和基于网络型的。
1)基于文件类型的套接字家族
套接字家族的名字:AF_UNIX
unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信
2)基于网络类型的套接字家族
套接字家族的名字:AF_INET
(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)
4、套接字工作流程
服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接。在这时如果有个客户端初始化一个Socket,然后连接服务器(connect),如果连接成功,这时客户端与服务器端的连接就建立了。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,一次交互结束。
★★★★★★TCP套接字工作流程(牢记)
复习三次握手与四次挥手
socket类
sk = socket.socket(socket.AF_INET,socket.SOCK_STREAM,0)
参数一:地址簇
socket.AF_INET IPv4(默认)
socket.AF_INET6 IPv6
socket.AF_UNIX 只能够用于单一的Unix系统进程间通信
参数二:类型
socket.SOCK_STREAM 流式socket , for TCP (默认)
socket.SOCK_DGRAM 数据报式socket , for UDP
参数三:协议
0 (默认)与特定的地址家族相关的协议,如果是 0 ,则系统就会根据地址格式和套接类别,自动选择一个合适的协议
sk.bind(address)
s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。
sk.listen(backlog)
开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。
backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5
这个值不能无限大,因为要在内核中维护连接队列
sk.setblocking(bool)
是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。
sk.accept()
接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
接收TCP 客户的连接(阻塞式)等待连接的到来
sk.connect(address)
连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
sk.connect_ex(address)
同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061
sk.close()
关闭套接字
sk.recv(bufsize[,flag])
接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。
sk.recvfrom(bufsize[.flag])
与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。
sk.send(string[,flag])
将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。即:可能未将指定内容全部发送。
sk.sendall(string[,flag])
将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
内部通过递归调用send,将所有内容发送出去。
sk.sendto(string[,flag],address)
将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。
sk.settimeout(timeout)
设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如 client 连接最多等待5s )
sk.getpeername()
返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
sk.getsockname()
返回套接字自己的地址。通常是一个元组(ipaddr,port)
sk.fileno()
套接字的文件描述符
基于TCP的套接字 |
举例学习:模拟FTP文件上传及断点续传
1 #tcp_server.py 2 from socket import * 3 4 ip_port = ('127.0.0.1',8000) 5 buffer_size = 1024 6 back_log = 5 7 8 server = socket(AF_INET,SOCK_STREAM) 9 server.bind(ip_port) 10 server.listen(back_log) 11 12 conn,addr = server.accept() 13 14 f_size = int(str(conn.recv(buffer_size).decode('utf-8'))) 15 conn.send(bytes(str(f_size).encode('utf-8'))) 16 recv_size=0 17 with open('2.txt', 'wb') as f: 18 while True: 19 if recv_size ==f_size: 20 break 21 else: 22 recv_msg = conn.recv(buffer_size) 23 f.write(recv_msg) 24 recv_size += len(recv_msg)
1 #tcp_client.py 2 from socket import * 3 import os 4 ip_port = ('127.0.0.1',8000) 5 buffer_size = 1024 6 back_log = 5 7 8 client = socket(AF_INET,SOCK_STREAM) 9 client.connect(ip_port) 10 11 file_size=os.stat('1.txt').st_size 12 client.send(str(file_size).encode('utf-8')) #先发送文件大小,解决粘包问题 13 msg = client.recv(buffer_size) 14 15 have_rec = 0 16 if int(str(msg.decode('utf-8'))) ==file_size: 17 with open('1.txt', 'rb') as f: 18 for line in f: 19 client.send(line) 20 have_rec+=len(line) 21 print('模拟断点出现') 22 break # 模拟出现断点的情况再续传 23 with open('1.txt', 'rb') as f: 24 f.seek(have_rec) # 文件指针指到已经上传完成的部分 25 for line in f: 26 client.send(line)
有时重启服务端时会出现:
解决方法:
#加入一条socket配置,重用ip和端口 ss=socket(AF_INET,SOCK_STREAM) ss.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) #在bind前加setsockopt ss.bind(('127.0.0.1',8000))
基于UDP的套接字 |
服务端
1 from socket import * 2 import time 3 ip_port=('127.0.0.1',9000) 4 BUFSIZE=1024 5 udp_server=socket(AF_INET,SOCK_DGRAM) #面向信息 6 #UDP无连接,所以可以同时多个客户端去跟服务端通信 7 udp_server.bind(ip_port) #需要绑定地址与端口号 8 9 while True: 10 msg,addr=udp_server.recvfrom(BUFSIZE) 11 print(msg.decode('utf-8'),addr) #hello ('127.0.0.1', 49448) 12 if not msg: 13 fmt ='%Y-%m-%d %X' 14 else: 15 fmt ='%Y:%m:%d %X' 16 back_time = time.strftime(fmt) 17 udp_server.sendto(back_time.encode('utf-8'),addr) #发送信息时需要后面带目的地址信息
客户端
1 from socket import * 2 ip_port=('127.0.0.1',9000) 3 BUFSIZE=1024 4 udp_client=socket(AF_INET,SOCK_DGRAM) 5 6 while True: 7 msg=input('>>: ').strip() 8 if not msg:continue 9 10 udp_client.sendto(msg.encode('utf-8'),ip_port) #发送带服务端地址信息 11 12 back_msg,addr=udp_client.recvfrom(BUFSIZE) 13 print(back_msg.decode('utf-8')) #2017:01:03 09:24:48
UDP模拟Win下cmd命令(会丢包)
from socket import * import subprocess ip_port = ('127.0.0.1',8000) back_log = 5 buffer_size = 1024 udp_server = socket(AF_INET,SOCK_DGRAM) udp_server.bind(ip_port) while True: cmd,addr = udp_server.recvfrom(buffer_size) print('新的客户端链接',addr) print('收到客户的命令是',cmd.decode('utf-8')) res = subprocess.Popen(cmd.decode('utf-8'),shell=True, stderr = subprocess.PIPE, stdout = subprocess.PIPE, stdin = subprocess.PIPE) err = res.stderr.read() if err: cmd_res =err else: cmd_res = res.stdout.read() udp_server.sendto(cmd_res,addr)
from socket import * ip_port = ('127.0.0.1',8000) back_log = 5 buffer_size = 1024 udp_client = socket(AF_INET,SOCK_DGRAM) while True: cmd =input('>>>').strip() if not cmd:continue if cmd =='quit':break udp_client.sendto(cmd.encode('utf-8'),ip_port) cmd_res,addr = udp_client.recvfrom(buffer_size) print('命令执行的结果是',cmd_res.decode('gbk')) udp_client.close()
TCP粘包 |