TCP包头
<--------------------------------32 位------------------------------>
0 8 16 24 32
|----------------|----------------|----------------|----------------| -----
| Source port | Destination port | |
|-------------------------------------------------------------------| |
| 序 号 |
|-------------------------------------------------------------------| 20字节
| 确 认 号 | 固 定
|-------------------------------------------------------------------| 首 部
| | | U A P R S F| |
|数据偏移 | 保 留 | R C S S Y I| 窗口 |
| | | G K H T N N| | |
|-------------------------------------------------------------------| |
| 校 验 和 | 紧急指针 |
|-------------------------------------------------------------------| -----
| 选 项 (长 度 可 变) | 填充 |
---------------------------------------------------------------------
TCP包头
-
源端口、目标端口 :计算机上的进程要和其他进程通信是要通过计算机端口的,而一个计算机端口某个时刻只能被一个进程占用,所以通过指定源端口和目标端口,就可以知道是哪两个进程需要通信。源端口、目标端口是用16位表示的,可推算计算机的端口个数为2^16个。
-
序列号 :表示本报文段所发送数据的第一个字节的编号。在TCP连接中所传送的字节流的每一个字节都会按顺序编号。由于序列号由32位表示,所以每2^32个字节,就会出现序列号回绕,再次从 0 开始。
-
确认号 :表示接收方期望收到发送方下一个报文段的第一个字节数据的编号。也就是告诉发送方:我希望你(指发送方)下次发送的数据的第一个字节数据的编号为此确认号。
-
数据偏移 :表示TCP报文段的首部长度,共4位,由于TCP首部包含一个长度可变的选项部分,需要指定这个TCP报文段到底有多长。它指出 TCP 报文段的数
据起始处距离 TCP 报文段的起始处有多远。该字段的单位是32位(即4个字节为计算单位),4位二进制最大表示15,所以数据偏移也就是TCP首部最大60字节。 -
URG :表示本报文段中发送的数据是否包含紧急数据。后面的紧急指针字段(urgent pointer)只有当URG=1时才有效。
-
ACK :表示是否前面确认号字段是否有效。只有当ACK=1时,前面的确认号字段才有效。TCP规定,连接建立后,ACK必须为1,带ACK标志的TCP报文段称为确认报文段。
-
PSH :提示接收端应用程序应该立即从TCP接收缓冲区中读走数据,为接收后续数据腾出空间。如果为1,则表示对方应当立即把数据提交给上层应用,而不是缓存起来,如果应用程序不将接收到的数据读走,就会一直停留在TCP接收缓冲区中。
-
RST :如果收到一个RST=1的报文,说明与主机的连接出现了严重错误(如主机崩溃),必须释放连接,然后再重新建立连接。或者说明上次发送给主机的数据有问题,主机拒绝响应,带RST标志的TCP报文段称为复位报文段。
-
SYN :在建立连接时使用,用来同步序号。当SYN=1,ACK=0时,表示这是一个请求建立连接的报文段;当SYN=1,ACK=1时,表示对方同意建立连接。SYN=1,说明这是一个请求建立连接或同意建立连接的报文。只有在前两次握手中SYN才置为1,带SYN标志的TCP报文段称为同步报文段。
-
FIN :表示通知对方本端要关闭连接了,标记数据是否发送完毕。如果FIN=1,即告诉对方:“我的数据已经发送完毕,你可以释放连接了”,带FIN标志的TCP报文段称为结束报文段。
-
窗口大小 :表示现在允许对方发送的数据量,也就是告诉对方,从本报文段的确认号开始允许对方发送的数据量,达到此值,需要ACK确认后才能再继续传送后面数据,由Window size value * Window size scaling factor(此值在三次握手阶段TCP选项Window scale协商得到)得出此值。
-
校验和 :提供额外的可靠性。
-
紧急指针 :标记紧急数据在数据字段中的位置。
-
选项部分 :其最大长度可根据TCP首部长度进行推算。TCP首部长度用4位表示,选项部分最长为:(2^4-1)*4-20=40字节。
常见选项:
-
最大报文段长度:Maxium Segment Size,MSS,通常1460字节
-
窗口扩大:Window Scale
-
时间戳: Timestamps
-
1 最大报文段长度MSS(Maximum Segment Size)
指明自己期望对方发送TCP报文段时那个数据字段的长度。比如:1460字节。数据字段的长度加上TCP首部的长度才等于整个TCP报文段的长度。 MSS不宜设的太大也不宜设的太小。若选择太小,极端情况下,TCP报文段只含有1字节数据,在IP层传输的数据报的开销至少有40字节(包括TCP报文段的首部和IP数据报的首部)。这样,网络的利用率就不会超过1/41。若TCP报文段非常长,那么在IP层传输时就有可能要分解成多个短数据报片。在终点要把收到的各个短数据报片装配成原来的TCP报文段。当传输出错时还要进行重传,这些也都会使开销增大。因此MSS应尽可能大,只要在IP层传输时不需要再分片就行。在连接建立过程中,双方都把自己能够支持的MSS写入这一字段。MSS只出现在SYN报文中。即:MSS出现在SYN=1的报文段中。- MTU和MSS值的关系:MTU=MSS+IP Header+TCP Header
- 通信双方最终的MSS值=较小MTU-IP Header-TCP Header
-
2 窗口扩大
为了扩大窗口,由于TCP首部的窗口大小字段长度是16位,所以其表示的最大数是65535。但是随着时延和带宽比较大的通信产生(如卫星通信),需要更大的窗口来满足性能和吞吐率,所以产生了这个窗口扩大选项。 -
3 时间戳
可以用来计算RTT(往返时间),发送方发送TCP报文时,把当前的时间值放入时间戳字段,接收方收到后发送确认报文时,把这个时间戳字段的值复制到确认报文中,当发送方收到确认报文后即可计算出RTT。也可以用来防止回绕序号PAWS,也可以说可以用来区分相同序列号的不同报文。因为序列号用32为表示,每2^32个序列号就会产生回绕,那么使用时间戳字段就很容易区分相同序列号的不同报文。
-
映射第四层到应用程序
TCP协议PORT
- 传输层通过port号,确定应用层协议
- Port number:
- tcp:传输控制协议,面向连接的协议;通信前需要建立虚拟链路;结束后拆除链路。
0-65535 - udp:User Datagram Protocol,无连接的协议。
0-65535
- tcp:传输控制协议,面向连接的协议;通信前需要建立虚拟链路;结束后拆除链路。
- IANA:互联网数字分配机构(负责域名,数字资源,协议分配)
-
0-1023:系统端口或特权端口(仅管理员可用) ,众所周知,永久的分配给固定的系统应用使用,22/tcp(ssh), 80/tcp(http), 443/tcp(https)
-
1024-49151:用户端口或注册端口,但要求并不严格,分配给程序注册为某应用使用,1433/tcp(SqlServer), 1521/tcp(oracle),3306/tcp(mysql),11211/tcp/udp(memcached)
-
49152-65535:动态端口或私有端口,客户端程序随机使用的端口。
其范围的定义:/proc/sys/net/ipv4/ip_local_port_range
-
TCP三次握手
握手 | 客户端状态 | 客户端TCP | 方向 | 服务器TCP | 服务器状态 | 描述 |
---|---|---|---|---|---|---|
第一次 | 初始:CLOSED 发送:SYN-SENT |
SYN=1, seq=x | ----> | 初始:LISTEN 接收:SYN-RECEIVED |
同步(SYN) | |
第二次 | 接收:SYN-SENT | <---- | SYN=1, ACK=1, seq=y, ack=x+1 | 发送:SYN-RECEIVED | 同步、确认(ACK) | |
第三次 | 发送:ESTABLISHED | ACK=1, seq=x+1, ack=y+1 | ----> | 接收:ESTABLISHED | 确认(ACK) | |
数据传输 | <---> |
TCP四次挥手
挥手 | 客户端状态 | 客户端TCP | 方向 | 服务器TCP | 服务器状态 | 描述 |
---|---|---|---|---|---|---|
第一次 | 初始:ESTABLISHED 发送:FIN-WAIT-1 |
FIN=1, seq=u | ----> | 初始:ESTABLISHED 接收:CLOSE-WAIT |
分手(FIN) | |
第二次 | 接收:FIN-WAIT-2 | <---- | ACK=1, seq=v, ack=u+1 | 发送:CLOSE-WAIT | 好的(ACK) | |
第三次 | 接收:FIN-WAIT-2 | <---- | FIN=1, ACK=1, seq=w, ack=u+1 | 发送:LAST-ACK | 分手(FIN+ACK) | |
第四次 | 发送:TIME-WAIT 2MSL后:CLOSED |
ACK=1, seq=u+1, ack=w+1 | ----> | 接收:CLOSED | 好的(ACK) |
为什么是三次握手、四次挥手
这是因为服务端在LISTEN状态下,收到建立连接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。而关闭连接时,当收到对方的FIN报文时,仅仅表示对方不再发送数据了但是还能接收数据,己方也未必全部数据都发送给对方了,所以己方可以立即close,也可以发送一些数据给对方后,再发送FIN报文给对方来表示同意现在关闭连接,因此,己方ACK和FIN一般都会分开发送。
这是因为服务端的LISTEN状态下的SOCKET当收到SYN报文的建连请求后,它可以把ACK和SYN(ACK起应答作用,而SYN起同步作用)放在一个报文里来发送。但关闭连接时,当收到对方的FIN报文通知时,它仅仅表示对方没有数据发送给你了;但未必你所有的数据都全部发送给对方了,所以你可以未必会马上会关闭SOCKET,也即你可能还需要发送一些数据给对方之后,再发送FIN报文给对方来表示你同意现在可以关闭连接了,所以它这里的ACK报文和FIN报文多数情况下都是分开发送的。
有限状态机FSM :Finite State Machine
FSM | 说明 |
---|---|
CLOSED | 没有任何连接状态 |
LISTEN | 侦听状态,等待来自远方TCP端口的连接请求 |
SYN-SENT | 在发送连接请求后,等待对方确认 |
SYN-RECEIVED | 在收到和发送一个连接请求后,等待对方确认 |
ESTABLISHED | 代表传输连接建立,双方进入数据传送状态 |
FIN-WAIT-1 | 主动关闭,主机已发送关闭连接请求,等待对方确认 |
FIN-WAIT-2 | 主动关闭,主机已收到对方关闭传输连接确认,等待对方发送关闭传输连接请求 |
TIME-WAIT | 完成双向传输连接关闭,等待所有分组消失 |
CLOSE-WAIT | 被动关闭,收到对方发来的关闭连接请求,并已确认 |
LAST-ACK | 被动关闭,等待最后一个关闭传输连接确认,并等待所有分组消失 |
CLOSING | 双方同时尝试关闭传输连接,等待对方确认 |
客户端先发送一个FIN给服务端,自己进入了FIN_WAIT_1状态,这时等待接收服务端的报文,该报文会有三种可能:
- 只有服务端的ACK
- 只有服务端的FIN
- 基于服务端的ACK,又有FIN
1、只收到服务器的ACK,客户端会进入FIN_WAIT_2状态,后续当收到服务端的FIN时,回应发送一个ACK,会进入到TIME_WAIT状态,这个状态会持续2MSL(TCP报文段在网络中的最大生存时间,RFC 1122标准的建议值是2min)。客户端等待2MSL,是为了当最后一个ACK丢失时,可以再发送一次。因为服务端在等待超时后会再发送一个FIN给客户端,进而客户端知道ACK已丢失。
2、只有服务端的FIN时,回应一个ACK给服务端,进入CLOSING状态,然后接收到服务端的ACK时,进入TIME_WAIT状态。
3、同时收到服务端的ACK和FIN,直接进入TIME_WAIT状态。
客户端的典型状态转移
- 客户端通过connect系统调用主动与服务器建立连接connect系统调用首先给服务器发送一个同步报文段,使连接转移到SYN_SENT状态。
- 此后connect系统调用可能因为如下两个原因失败返回:
1、如果connect连接的目标端口不存在(未被任何进程监听),或者该端口仍被处于TIME_WAIT状态的连接所占用(见后文),则服务器将给客户端发送一个复位报文段,connect调用失败。
2、如果目标端口存在,但connect在超时时间内未收到服务器的确认报文段,则connect调用失败。
connect调用失败将使连接立即返回到初始的CLOSED状态。如果客户端成功收到服务器的同步报文段和确认,则connect调用成功返回,连接转移至ESTABLISHED状态。
当客户端执行主动关闭时,它将向服务器发送一个结束报文段,同时连接进入FIN_WAIT_1状态。若此时客户端收到服务器专门用于确认目的的确认报文段,则连接转移至FIN_WAIT_2状态。当客户端处于FIN_WAIT_2状态时,服务器处于CLOSE_WAIT状态,这一对状态是可能发生半关闭的状态。此时如果服务器也关闭连接(发送结束报文段),则客户端将给予确认并进入TIME_WAIT状态。
客户端从FIN_WAIT_1状态可能直接进入TIME_WAIT状态(不经过FIN_WAIT_2状态),前提是处于FIN_WAIT_1状态的服务器直接收到带确认信息的结束报文段(而不是先收到确认报文段,再收到结束报文段)。
处于FIN_WAIT_2状态的客户端需要等待服务器发送结束报文段,才能转移至TIME_WAIT状态,否则它将一直停留在这个状态。如果不是为了在半关闭状态下继续接收数据,连接长时间地停留在IN_WAIT_2状态并无益处。连接停留在FIN_WAIT_2状态的情况可能发生在:客户端执行半关闭后,未等服务器关闭连接就强行退出了。此时客户端连接由内核来接管,可称之为孤儿连接(和孤儿进程类似)。
Linux为了防止孤儿连接长时间存留在内核中,定义了两个内核参数:
- /proc/sys/net/ipv4/tcp_max_orphans 指定内核能接管的孤儿连接数目
- /proc/sys/net/ipv4/tcp_fin_timeout 指定孤儿连接在内核中生存的时间
有限状态机
TCP协议中的三次握手和四次挥手
客户机端的三次握手和四次挥手、服务器端的三次握手和四次挥手