• Java网络编程基础之TCP粘包拆包


    TCP是个“流”协议,所谓流,就是没有界限的一串数据。大家可以想象河里的流水,他们是连成一片的,其间并没有分界线。TCP底层并不了解上层业务数据的具体含义,他会根据TCP缓冲区的实际情况进行包的划分,所以在业务上认为,一个完整的包可能会被TCP拆分成多个包进行发送,也有可能把多个小的包封装成一个大的数据包发送。这就是TCP所谓的拆包和粘包的问题。

    一、TCP粘包/拆包问题说明

    我们可以通过图解对TCP粘包和拆包问题进行说明,粘包问题如图。

    image

    假设客户端分别发送了两个数据包D1和D2给服务端,由于服务端一次读取到的字节数是不确定的,故可能存在以下4中情况。

    • 服务端分两次读取到了两个独立的数据包,分别是D1和D2,没有粘包和拆包。
    • 服务端一次接收到了两个数据包,D1和D2粘在一起,被称为TCP粘包
    • 服务端分两次读取到了两个数据包,第一次读取到了完整的D1包和D2包的部分内容,第二次读取到了D2包的剩余内容,这被称为TCP拆包。
    • 服务端分两次读取到了两个数据包,第一次读取到了D1包的部分内容D1_1,第二次读取到了D1包的剩余内容D1_2和D2包的整包。

    如果此时服务端TCP接收滑窗非常小,而数据包D1和D2比较大,很有可能会发生第五种可能,即服务端分多次才能将D1和D2包接收完全,期间发生多次拆包。

    二、TCP粘包/拆包发生的原因

    问题产生的原因有三个,分别如下。

    • 应用程序write写入的字节大小大于套接口发送缓冲区大小。
    • 进行MSS大小的TCP分段。
    • 以太网帧的payload大于MTU进行IP分片。

    三、粘包问题的解决策略

    由于底层的TCP无法理解上层的业务数据,所以在底层是无法保证数据包不被拆分和重组的,这个问题只能通过上层的应用协议栈设计来解决,根据业界的主流协议的解决方案,可以归纳如下。

    • 消息定长,例如每个报文的大小为固定长度200字节,如果不够,空位补空格
    • 在包尾增加回车换行符进行分割,例如FTP协议
    • 将消息分为消息头和消息体,消息头中包含表示消息总长度(或者消息体长度)的字段,通常涉及思路为消息头的第一个字段使用int32来表示消息的总长度
    • 更复杂的应用层协议。
  • 相关阅读:
    javaScript 事件循环机制
    javaScript 原型与原型链
    清除浮动
    水平垂直居中的实现
    GitLab + Jenkins + Harbor 工具链快速落地指南
    a标签下载存储在项目中的文件
    判断数组对象中某一属性是否包含重复的值
    网站title前的小图标
    给二维数组动态赋值
    格式化eltable中的时间
  • 原文地址:https://www.cnblogs.com/f-zhao/p/7502075.html
Copyright © 2020-2023  润新知