一、粘包分析
作者本人在写一个FTP项目时,在文件的上传下载模块遇到了粘包问题。在网上找了一些解决办法,感觉对我情况都不好用,因此自己想了个比较好的解决办法,提供参考
1.1 粘包现象
在客户端与服务器使用tcp通讯中,不同于http短连接,长链接在发送接收数据包过程中,多个数据包沾粘在一起,导致数据混乱的情况。
1.2 原因分析
-
发送方:
TCP是一种安全的连接,这就导致了他的效率相对其他传输方式较低。为了提升效率TCP会将多个相连数据包合并放到缓冲区,然后一次性发送过去。对于接受方来说这是未知的。这些小数据包之间没有分割界限,接收方就无法解析分开。这是TCP协议内部使用的Nagle算法导致的。 -
接收方
TCP本身是一种面向流传输,不管是发送发,还是接收方,系统都会把数据放到缓冲区,当缓冲区满了之后一次性发送,和读取。所以可以想一下,假如你上次发送的数据还剩下几B没发送,留在缓冲区,然后下一个命令数据包,到了缓冲区,一次发过去。或者同样的接受方这边读取的时候,发生这样的粘包现象.
二、解决方式
- 禁用Nagel算法,不推荐。
- 像http一样每传输一次数据断开连接一次,不推荐,太浪费开销和时间。
- 命令包设置报头flag。接收方读取flag,根据不同的任务决定是否开辟独立线程去连接服务器。如FTP上传下载就可以开辟独立线程,带着服务端的验证信息,去连接它直接完成任务
2.1 自定义数据包报头
自定协议,将数据包分为了封包和解包两个过程。在发送方发送数据时,对发送的数据进行封包操作。在接收方接收到数据时对接收的数据包需要进行解包操作。
自定协议时,封包就是为发送的数据增加包头,包头包含数据的处理方式、长度、md5,权限、操作人、创建时间等等,数据就跟随在包头之后。当然包头也可以有其他的信息,比如一些做校验的信息。这里主要讨论TCP粘包的问题,就不说太多了。
client拿到数据包,根据数据的处理方式,做出对应的operation,然后接收指定大小的数据。