socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。
socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。 socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)
socket和file的区别:
file模块是针对某个指定文件进行【打开】【读写】【关闭】
socket模块是针对 服务器端 和 客户端Socket 进行【打开】【读写】【关闭】
scoket 实现流程:
小例子:
服务端:
#!/usr/bin/env python
# Version = 3.5.2
# __auth__ = '无名小妖'
import socket
ip_port = ('127.0.0.1',9999)
sk = socket.socket()
sk.bind(ip_port)
sk.listen(5)
while True:
print('server waiting...')
conn, addr = sk.accept()
client_data = conn.recv(1024)
# print(conn,addr)
print(str(client_data,encoding='utf8'))
conn.sendall(bytes('不要回答,不要回答,不要回答',encoding='utf8'))
conn.close()
客户端:
#!/usr/bin/env python
# Version = 3.5.2
# __auth__ = '无名小妖'
import socket
ip_port = ('127.0.0.1',9999)
sk = socket.socket()
sk.connect(ip_port)
sk.sendall(bytes('请求占领地球',encoding='utf8'))
server_reply = sk.recv(1024)
print(str(server_reply,encoding='utf8'))
sk.close()更多功能
sk = socket.socket(socket.AF_INET,socket.SOCK_STREAM,0)
参数一:地址簇
socket.AF_INET IPv4(默认)
socket.AF_INET6 IPv6
socket.AF_UNIX 只能够用于单一的Unix系统进程间通信
参数二:类型
socket.SOCK_STREAM 流式socket , for TCP (默认)
socket.SOCK_DGRAM 数据报式socket , for UDP
socket.SOCK_RAW 原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。
socket.SOCK_RDM 是一种可靠的UDP形式,即保证交付数据报但不保证顺序。SOCK_RAM用来提供对原始协议的低级访问,在需要执行某些特殊操作时使用,如发送ICMP报文。SOCK_RAM通常仅限于高级用户或管理员运行的程序使用。
socket.SOCK_SEQPACKET 可靠的连续数据包服务参数三:协议
0 (默认)与特定的地址家族相关的协议,如果是 0 ,则系统就会根据地址格式和套接类别,自动选择一个合适的协议
详细介绍:
sk.bind(address)
sk.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。
sk.listen(backlog)
开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。 backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5。 这个值不能无限大,因为要在内核中维护连接队列
sk.setblocking(bool)
是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。
sk.accept()
接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
接收TCP 客户的连接(阻塞式)等待连接的到来
sk.connect(address)
连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
sk.connect_ex(address)
同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061
sk.close()
关闭套接字
sk.recv(bufsize[,flag])
接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。
sk.recvfrom(bufsize[.flag])
与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。
sk.send(bytes[,flag])
将bytes中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于bytes的字节大小。即:可能未将指定内容全部发送。sk.sendall(bytes[,flag])
将bytes中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。内部通过递归调用send,将所有内容发送出去。
sk.sendto(bytes[,flag],address)将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。
sk.settimeout(timeout)
设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如 client 连接最多等待5s )
sk.getpeername()
返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
sk.getsockname()
返回套接字自己的地址。通常是一个元组(ipaddr,port)
sk.fileno()
套接字的文件描述符了解了基本用法后,我们在看看有那些需要注意的:
1.基于python3.5.2版本的socket只能收发字节(python2.7可以发送字符串);2.客户端退出不能影响服务端;3.sk.accept()和sk.recv()是阻塞的(连接正常的情况下);4.send返回发送的字节数并且不一定把全部数据发送。sendall会循环调用send,直至全部发送;客户端退出不能影响服务端的列子:服务端代码:import socket, subprocess
ip_port = ('127.0.0.1', 9995)
server = socket.socket()
server.bind(ip_port)
server.listen(3)
# 此while循环为了持续的接收连接(当一个连接断开,接收另一个)
while True:
conn, addr = server.accept()
# 此while循环为了持续收发消息
while True:
try:
recv_data = conn.recv(1024)
print(recv_data,'xxx')
if recv_data == bytes('exit',encoding='utf8'):
break
elif len(recv_data) == 0: # 当客户端发送空后,服务端退出本次连接
break
send_data = recv_data.upper()
conn.send(send_data)
except Exception as e:
print(e)
break
conn.close()客户端代码:import socket
ip_port = ('127.0.0.1', 9995)
# 买手机
client = socket.socket()
# 拨号
client.connect(ip_port)
while True:
# 发消息
send_data = input('>>>').strip()
client.send(bytes(send_data, encoding='utf8'))
if send_data == 'exit':
break
elif send_data == '':
continue
# 收消息
recv_data = client.recv(1024)
print('>>>{}'.format(str(recv_data, encoding='utf8')))-----------------------------------------------------------------------------------------------再来一个高级点的列子,用socket实现ssh功能:
服务端代码:import socket, subprocess
ip_port = ('127.0.0.1', 9999)
server = socket.socket()
server.bind(ip_port)
server.listen(3)
# 此while循环为了持续的接收连接(当一个连接断开,接收另一个)
while True:
conn, addr = server.accept()
# 此while循环为了持续收发消息
while True:
try:
recv_data = conn.recv(1024)
print(recv_data,'xxx')
if recv_data == bytes('exit',encoding='utf8'):
break
elif len(recv_data) == 0: # 当客户端发送空后,服务端退出本次连接
break
p = subprocess.Popen(str(recv_data,encoding='utf8'),shell=True,stdout=subprocess.PIPE)
res = p.stdout.read()
if len(res) == 0: # 客户端输入错误命令时,服务端返回空
send_data = 'cmd error'else:# 由于windows是gbk编码,所以需要进行解码(gbk无法直接转化为utf8,必须先转为字符串)
send_data = str(res,encoding='gbk')
conn.send(bytes(send_data,encoding='utf8'))
except Exception as e:
print(e)
break
conn.close()客户端代码:
import socket
ip_port = ('127.0.0.1', 9999)
# 买手机
client = socket.socket()
# 拨号
client.connect(ip_port)
while True:
# 发消息
send_data = input('>>>').strip()
client.send(bytes(send_data, encoding='utf8'))
if send_data == 'exit':
break
elif send_data == '':
continue
# 收消息
recv_data = client.recv(1024)
print('>>>{}'.format(str(recv_data, encoding='utf8')))------------------------------------------------------------------------------------------
粘包问题
当服务端要反馈的数据大于客户端一次能接收的大小时,服务端的剩余数据就会“残留”在服务器端,下次反馈数据时会先把残存的数据先发送到客户端,造成请求的数据和反馈的数据不相对应,这种现象就是 粘包。
解决粘包的方法很简单,就是服务器端提前告诉客户端要发送多大的数据,然后客户端循环接收,直到接收完毕,退出循环。
代码实现:
服务器端:
#!/usr/bin/env python
# Version = 3.5.2
# __auth__ = '无名小妖'
import socket, subprocess
ip_port = ('127.0.0.1', 9999)
server = socket.socket()
server.bind(ip_port)
server.listen(3)
# 此while循环为了持续的接收连接(当一个连接断开,接收另一个)
while True:
conn, addr = server.accept()
# 此while循环为了持续收发消息
while True:
try: # 客户端异常关闭处理
recv_data = conn.recv(1024)
print(recv_data,'xxx')
if recv_data == bytes('exit', encoding='utf8'):
break
elif len(recv_data) == 0: # 当客户端发送空后,服务端退出本次连接
break
p = subprocess.Popen(str(recv_data,encoding='utf8'),shell=True,stdout=subprocess.PIPE)
res = p.stdout.read()
if len(res) == 0: # 客户端输入错误命令时,服务端返回空
send_data = 'cmd error'
else:
# 将gbk转为utf8,需要先转为str作为过度
send_data = str(res, encoding='gbk')
send_data = bytes(send_data, encoding='utf8')
# 发送一个说明,告诉客户端要发送多大的包(解决粘包问题)
ready_flag = 'Ready|{}'.format(len(send_data))
conn.send(bytes(ready_flag, encoding='utf8'))
feed_back = conn.recv(1024)
feed_back = str(feed_back,encoding='utf8')
if feed_back == 'Start':
conn.send(send_data)
print(str(send_data, encoding='utf8'))
except Exception as e:
print(e)
break
conn.close()客户端:#!/usr/bin/env python
# Version = 3.5.2
# __auth__ = '无名小妖'
import socket
ip_port = ('127.0.0.1', 9999)
# 买手机
client = socket.socket()
# 拨号
client.connect(ip_port)
while True:
# 发消息
send_data = input('>>>').strip()
client.send(bytes(send_data, encoding='utf8'))
if send_data == 'exit':
break
elif send_data == '':
continue
# 处理服务端发送过来的说明,明确即将收多大包(解决粘包问题)
ready_tag = client.recv(1024)
ready_tag = str(ready_tag, encoding='utf8')
if ready_tag.startswith('Ready'):
msg_size = int(ready_tag.split('|')[-1])
start_tag = 'Start'
client.send(bytes(start_tag,encoding='utf8'))
recv_size = 0
recv_msg = b''
while recv_size < msg_size:
recv_data = client.recv(1024)
recv_msg += recv_data
recv_size += len(recv_data)
print(recv_size,msg_size)
# 收消息
print('>>>{}'.format(str(recv_msg, encoding='utf8')))
------------------------------------------------------------------------------------------
SocketServer模块
SocketServer内部使用 IO多路复用 以及 “多线程” 和 “多进程” ,从而实现并发处理多个客户端请求的Socket服务端。
即:每个客户端请求连接到服务器时,Socket服务端都会在服务器是创建一个“线程”或者“进程” 专门负责处理当前客户端的所有请求。
下面看一个简单的socketserver的例子:
服务器端:
import socketserver
class SocketServer(socketserver.BaseRequestHandler):
def handle(self):
self.request.sendall(bytes('Welcome to my socketserver!',encoding='utf8'))
while True:
recv_data = self.request.recv(1024)
self.request.sendall(recv_data.upper())
if __name__ == '__main__':
server = socketserver.ThreadingTCPServer(('127.0.0.1',8889),SocketServer)
server.serve_forever()
客户端:
import socket
ip_port = ('127.0.0.1',8889)
sk = socket.socket()
sk.connect(ip_port)
WELCOME_WORDS = sk.recv(1024)
print(WELCOME_WORDS.decode())
while True:
send_data = input('>>>').strip()
sk.send(bytes(send_data, encoding='utf8'))
recv_data = sk.recv(1024)
print(recv_data.decode())
sk.close()
-----------------------------------------------------------------------------------
打印进度条的知识点:
python2.7:
while True:
for i in ["/","-","|","\","|"]:print "%s " % i,
python3.5:
while True:
for i in ["/","-","|","\","|"]:
print("%s" % i,end=' ')关键就是 的运用,它的功能就是从头开始覆盖上一次相应位置打印的内容。
需要注意的就是:第一次打印了个“123”,第二次打印“9”,那么第二次就会显示“923”。
要解决这个问题可以每次先打印和上次长度相同的空格。