• 【TCP】可靠数据传输


    TCP可靠数据传输

      在TCP在IP不可靠的尽力而为的服务之上,创建了一条可靠数据传输服务(reliable data transfer service)
    TCP提供的可靠数据传输的方法涉及到可靠数据传输原理中许多机制。
      也涉及到了定时器。如果为每一个已发送但未被确认的报文段都设置一个定时器,那开销是相当巨大的。因此
    推荐的定时器管理过程[RFC 6298]仅适用单一的重传定时器。下面描述的TCP协议遵从了这种单一的定时器推荐。

      TCP是使用超时冗余确认技术来恢复报文段的丢失

    TCP发送方有3个与发送和重传有关的事件

    • 从上层应用程序接收数据
      TCP从应用程序接收数据,将数据封装在一个报文段中(含有第一个数据字节的流编号),然后交给IP。

    • 定时器超时
      超时后,TCP重传超时报文,然后,重启定时器。

    • 收到ACK
      收到ACK后,将确认报文中确认号与发送方的SendBase(最早未被确认的字节序号)比较。
      TCP采取累积确认,所以确认号之前的字节都被接收方收到。
      当 确认号 > SendBase 时,则该ACK是在确认一个或多个先前未被确认的报文段,此时发送方更新
      SendBase的值
      如果当前有未被确认的报文段,TCP重启定时器

    TCP协议在工作过程中的几种简单情况

    1.由于确认丢失而重传

          

      如上图所示,B发送给A的ACK丢失,引起了主机A的重传,B在接收到重传数据报后根据序号得知这是重传报文,于是丢弃该报文,向A发送ACK。

    2.连续发送的报文段的ACK延迟

          

      A连续向B发送了两个报文段,但是他们的ACK都延迟了,导致定时器超时,于是最早的未被确认的报文段92被重
    传,接着他们的ACK到达,它们就不会被再次重传,A收到确认后,就会将SendBase后移,并重启定时器。

    3.累积确认避免先前报文段重传

          

      A还是向B连续发送了两个报文段,但是第一个报文段的ACK丢失啦。但是好的是在定时器超时之前,第二个报文
    段的ACK到达,因为TCP采取了累计确认,第二个报文段ACK到达,说明了第一个报文段是被正确接收了哒。所以第一个报文段不会被重传。

    快速重传

      超时重传存在的问题之一就是超时周期可能较长。当一个报文段丢失时,通过超时重传来恢复报文,就会增加端
    到端的时延。Luckily,可以通过检测收到的冗余ACK来进行对丢失报文段的重传。


      至于为啥可以通过这样的方式来确信此报文段丢失是因为:
      ①发送方接到丢失报文段后的报文(也就是失序报文段)会将失序报文段缓存,并向发送方发送最近接收的未失
      序报文段的最大编号。
      ②如果接收方连续接收多个失序报文,那么发送方将会收到对一个报文段的多个ACK,由此发送方可知该ACK代
      表的报文段的后一个报文丢失了,于是,发送方重传丢失报文。

      当发送方收到3个冗余ACK,就说明被确认过三次的报文段之后的那个报文段已经丢失,TCP就执行快重传
      (fast retransmit),在丢失报文段定时器超时之前重传丢失报文段。

          

                  上图是快重传的一个示例

    是回退N步还是选择重传

      根据前面对TCP描述,可以得知TCP确认是采用累积确认方式,并且对失序报文不会给出确。这让TCP看起来像是一个GBN协议,但是与GBN不同的是,TCP会缓存失序的分组。所以,TCP提出的一种修改意见是选择确认(slective acknowledgment)[RFC 2018],它允许TCP接收方有选择地确认失序报文段,而不是累积确认最后一个正确接收的有序报文段。当将该机制和选择重传机制结合起来使用时(即跳过重传那些已被接收方选择确认过的报文段),TCP就像我们通常的SR协议。

      因此,TCP的差错恢复机制为GBN协议和SR协议的混合体。

    TCP流量控制

    为什么要提供流量控制服务(flow-control service)?

      简单地说,提供流控就是为了避免接收方缓存溢出问题。

      接收方接收到数据后,会将其放入接收缓存中,待上层应用程序读取数据。但是上层应用可能忙于其他事务或者
      读取数据的速度比较慢,而发送方发送数据的太多,速率太快,此时就会导致接收方的缓存溢出。
      流量控制也是一个速率匹配服务。

      TCP的发送方也可能会因为IP网络拥塞而被遏制,这种形式的控制被称为拥塞控制(congestion control)。这两
      种控制是针对不同原因而采取的,尽管他们都是对发送方的遏制。后面会讲他们之间的区别。

    TCP如何提供流量控制服务 ?

      这里为了从整体上看问题,我们假设,TCP接收方会丢弃失序的报文。

    1. TCP让发送方A维护一个称为接收窗口(receive window)的变量来提供流量控制。这个窗口代表接收方B有多少可的缓存空间
    2. 主机A和主机B之间建立TCP连接后,主机B为连接分配了一个接收缓存,用RcvBuffer表示
      定义如下变量
    • LastByteRead:主机B的应用进程从缓存中取出的数据流最后一个字节的编号
    • LastByteRevd:主机B缓存的数据流的最后一个字节编号


    缓存不能溢出需满足

                             LastByteRevd - LastByteRead <= RevBuffer
    


    接收窗口rwnd根据缓存可用空间设置:

                            rwnd = RevBuffer - [LastByteRevd-LastByteRead]
    

    3. 主机B通过把当前的rwnd放到它发送给主机A的报文段的接收窗口字段,已通知主机A当前它还有多少空间可用。 4. 主机A始终跟踪两个LastByteSend和LastByteAcked,[LastByteSend-LastByteAcked]就是主机A中发送但未被确认的数据量。使这个值小于主机B的rwnd,就可以使主机B的缓存不会溢出。
    因此,主机A需要在连接的整个生命周期满足: ``` LastByteSend-LastByteAcked <= rwnd ```
    如何防止死锁?

    死锁问题出现
      主机B的接收缓存满了,rwnd=0。主机A知道了就会暂停数据发送,等待主机B的接收缓存有空闲。如果此时主机B没有数据发送给A那么A将不可能知道主机B会有缓存空闲,这会导致A被阻塞(主机B仅当他有数据发送或者有确认时才会发送报文段给A) !

    解决死锁问题
      当发送方A收到接收方B的窗口为0的通知,便启动一个一个持续计数器,每隔一段时间向B发送只有一个字节数据的零窗口探测报文段。这些报文段将被接收方确认。最终缓存将开始清空,并且确认报文里包含一个非0的rwnd值。


      此文为《计算机网络 自顶向下方法》的学习笔记5,文中图来自本书。

  • 相关阅读:
    Spark记录-SparkSQL远程操作MySQL和ORACLE
    Spark记录-Spark on Yarn框架
    Linux记录-重启后磁盘丢失问题解决方案
    Spark记录-阿里巴巴开源工具DataX数据同步工具使用
    Spark记录-SparkSql官方文档中文翻译(部分转载)
    Spark记录-SparkSQL一些操作
    Spark记录-Spark-Shell客户端操作读取Hive数据
    Spark记录-SparkSQL相关学习
    Spark记录-Scala程序例子(函数/List/match/option/泛型/隐式转换)
    CM记录-升级Spark版本到2.x(转载)
  • 原文地址:https://www.cnblogs.com/myworld7/p/8372510.html
Copyright © 2020-2023  润新知