• TCP建立连接通过三次握手,释放连接通过四次挥手


    tcp建立连接通过三次握手、释放连接通过四次挥手

    一、tcp建立连接通过三次握手

    首先tcp的特性:tcp是面向连接的安全可靠的传输协议。
    传输连接是用来传送tcp报文的。tcp传输连接的建立和释放是每一次面向连接的通信中必不可少的过程。因此,传输连接就有三个阶段:连接建立、数据传输、连接释放。传输连接的管理就是使传输连接的建立和释放都能正常的进行。
    在tcp连接建立的过程中要解决以下三个问题:
    1.要使每一方都能够确知对方的存在。
    2.要允许双方协商一些参数(如最大窗口值、是否使用窗口扩大选项和时间戳选项以及服务质量等)。
    3.能够对传输实体资源(如缓存大小、连接表中的项目等)进行分配。


    tcp连接的建立采用客户服务器模式。主动发起建立连接的应用进程叫做客户端(client),而被动等待连接建立的应用进程叫服务器(server)。
    tcp建立连接的过程如下图所示:

    解释连接过程:
    主机A是运行的tcp客户端程序,主机B是运行的tcp服务器端程序。最初两端的tcp进程都处于closed(关闭)状态。注意是A主动打开连接,而B是被动打开连接。
    B的tcp服务器进程先创建传输控制块PCB(pcb存储了每一个连接中的一些重要信息,如:tcp连接表,到发送和接收缓存的指针,到重传队列的指针,当前的发送和接收序号等),准备接收客户A进程的连接请求。然后服务器进程就处于listen(收听)状态,等待客户的连接请求。如果有请求则做出响应。
    第一次握手
    A的tcp客户进程也是首先创建传输控制块PCB,然后向服务器B发出连接请求报文段,这时首部中的同步为SYN=1,同时选择一个初始序号seq=x。TCP规定,SYN报文段(即SYN=1的报文段)不能携带数据,但是要消耗掉一个序号。 这时tcp客户进程进入SYN-SENT(同步已发送)状态。
    第二次握手
    B收到连接请求报文段后,如同意建立连接,则向A发送确认。在确认报文段中应把SYN位和ACK位都置为1,确认号是ack=x+1,同时也为自己选择一个初始序号seq=y。请注意这个SYN=1的报文段也不能携带数据,但同样要消耗掉一个序号。这时tcp服务器进程进入SYN-RCVD(同步收到)状态。
    第三次握手
    TCP客户A进程收到B的确认后,还要向B发出确认。确认报文段的ACK置为1,确认号ack=y+1,而自己的序号seq=x+1。TCP的标准规定,ACK报文段可以携带数据。这时tcp连接已经建立,A进入established(已建立连接)状态。当B收到A的确认后,也进入established(已建立连接)状态。

    至此连接的三次握手完成。
    可以简单的这样理解:
    客户进程:请求连接,发送一个同步报文syn=1,序号seq=x
    服务器进程:收到,允许连接,发送一个确认报文ack=x+1,seq=y
    客户进程:好的,发送一个确认报文ack=y+1,序号seq=x+1,这时客户进程已建立连接
    服务器进程:收到,这时服务器进程已建立连接。
    完成连接,开始传输和接收数据。

    为什么客户A还要向服务器B发送一次确认?因为这主要是为了防止已失效的连接请求报文段突然又传送到了B,从而产生错误。

    二、tcp释放连接的四次挥手过程

    tcp释放连接的过程比较复杂,需要经过四次握手也叫四次挥手过程。
    数据传输结束后,通信的双方都可释放连接。现在客户进程A和服务器进程B都处于established(连接)状态,如下图所示:

    客户A的应用进程先向其TCP发出连接释放报文段,并停止在发送数据,主动关闭TCP连接。A把连接释放报文段首部的终止控制位FIN置1,其序号为seq=u,它等于前面已传送过的数据的最后一个字节的序号加1。这时A进入FIN-WAIT-1(终止等待1)状态,等待服务器B的确认。注意:TCP规定,FIN报文段即使不携带数据也要消耗掉一个序号。

    服务器B收到连接释放报文段后即发出确认,确认号是ack=u+1,而这个报文段自己的序号是v即seq=v,等于B前面已传送过的数据的最后一个字节的序号加1。然后B进入CLOSE-WAIT(关闭等待)状态。TCP服务器进程这时应通知高层应用进程,因而从A到B这个方向的连接就释放了,这时的TCP连接处于半关闭(half-close)状态,即客户进程A已经没有数据要发送了,但是B若要发送数据,A仍然要接收。也就是说从B到A这个方向的连接并没有关闭,这个状态可能会持续一段时间。

    客户进程A收到来自B的确认后,就进入FIN-WAIT-2(终止等待2)状态,等待B发出的连接释放报文段。

    若服务器B已经没有要向A发送的数据,其应用进程就通知TCP释放连接。这时B发出的连接释放报文段必须使FIN=1。现假定B的序号seq=w(在半关闭状态B可能又发送了一些数据)。B还必须重复上次已发送过的确认号ack=u+1。这时B就进入了LAST-ACK(最后确认)状态,等待A的确认。

    客户进程A在收到B的连接释放报文段后,必须对此发出确认。在确认报文段中把ACK置为1,确认号ack=w+1,而自己的序号seq=u+1(根据TCP标准,前面发送过的FIN报文段要消耗掉一个序号)。然后进入到TIME-WAIT(时间等待)状态。注意:现在TCP连接还没有释放掉。必须经过时间等待计时器(TIME-WAIT timer)设置的时间2MSL后,客户进程A才进入到CLOSED状态。时间MSL叫做最长报文段寿命(Maximum Segment Lifetime)。当A撤销相应的传输控制块PCB后,就结束了这次的TCP连接。

    为什么A在TIME-WAIT(时间等待)状态必须等待2MSL的时间呢?有两个原因。

    原因之一:
    为了保证客户A进程发送的最后一个确认ACK报文段能够达到B。这个确认ACK报文段有可能丢失,因而使处在LAST-ACK状态的B收不到对已发送的FIN+ACK报文段的确认。B会超时重传这个FIN+ACK报文段,而A就能在2MSL时间内收到这个重传的FIN+ACK报文段。接着A重传一次确认,重新启动2MSL计时器。最后A和B都能正常进入到CLOSED状态。如果A在TIME-WAIT状态不等待一段时间,而是在发送完ACK报文段后立即释放连接,那么就无法收到B超时重传的FIN+ACK报文段,因而也不会在发送一次确认报文段。这样B就无法按照正常步骤进入CLOSED状态。
    原因之二:
    防止“已失效的连接请求报文段”出现在本连接中。A在发送完最后一个ACK报文段后,在经过时间2MSL,就可以使本连接持续的时间内所产生的所有报文段都从网络中消失。这样就可以使下一个新的连接中不会出现这种旧的连接请求报文段。

    B只要收到了A发出的确认,就进入CLOSED状态。同样,B在撤销相应的传输控制块PCB后就结束了这次TCP连接。注意:B结束tcp连接的时间要比A早一些。

    除了时间等待计时器外,TCP还设有一个保活计时器(keepalive timer)。设想有这样的情况:客户已主动与服务器建立了连接,但后来客户端的主机突然出故障,显然服务器以后就不能在收到客户发来的数据。因此,应当有措施使服务器不在白白等待下去,否则将会浪费很多资源,这就要使用保活计时器。服务器每收到一次客户的数据,就重新设置保活计时器,时间的设置通常是两小时。若两小时没有收到客户的数据,服务器就发送一个探测报文段,以后则每隔75分钟发送一次,若一连发送10个探测报文段后客户仍没有响应,服务器就认为客户端出现了故障,紧接着就关闭这个连接。

    三、输入URL地址按下enter经历的过程

    http是一种协议,计算机之间要彼此通信需要共同遵守协议规则。
    1、用户将url(例如www.baidu.com)输入至地址栏并回车后,首先浏览器会开启一个线程来处理这个请求对URL判断,如果是http协议就按照web方式处理;
    2、然后浏览器会先搜索自身的DNS(Domain Name System,域名系统)缓存开始,一级一级往上搜索。意思是浏览器先在自身的DNS缓存(这涉及浏览器的缓存机制)中搜索是否有www.baidu.com这个域名;如果浏览器从自身的DNS缓存中未搜索到(也有可能是因为缓存已经失效,即缓存的时间到期了。以chrome为例,你可以在地址栏输入:chrome://net-internals/#dns来查询自己曾经访问过的网站),那么浏览器会搜索操作系统(本地计算机)自身的DNS缓存, 如果本地操作系统的DNS缓存还是没找到,那么浏览器便会尝试去读取本地的HOST文件,这个HOST文件可以根据以下路径找到,即C:WindowsSystem32driversetc

    如下图所示:

    如果在HOST文件中还是没有找到对应的配置项,那么便会从路由器(前提是你连接的是无线网络,如果是宽带连接,那么便会省略该步)缓存中搜索;计算机在通信时是通过IP地址辨识,而不是域名。域名只是为了方便用户使用。域名查找顺序:本地缓存->系统缓存->浏览器缓存->ISP缓存->根域名服务器->主域名服务器。只要在其中某一个地方找到ip地址就进入下一步操作。

    DNS通过解析域名获得ip地址,其流程如下:
    1、在主机查询DNS缓存,如果没有就会给本地的DNS服务器发送查询请求;
    2、本地的DNS服务器向根域名服务器发送查询请求,根域名服务器返回该域名的一级域名服务器;
    3、本地服务器给返回的一级域名服务器发送查询请求,然后依次类推直到查询到该域名的IP地址为止。

    3、如果上述过程,在任何一个缓存中找到,那么便直接在屏幕中显示页面内容,如果都没找到的话,浏览器会发起一个DNS的系统调用,就是向本地主DNS服务器(一般来说是你宽带运营商提供的服务器)发起一个域名解析请求。 宽带运营商服务器会查看本身缓存,查找对应的条目,看有没有过期或者有没有这个条目;如果依旧没查找到,运营商服务器会代替浏览器发起一个迭代DNS解析的请求。意思是运营商服务器会去找根域(就是运营商服务器的上级服务器)的DNS IP地址,如果根域服务器查不到www.baidu.com的IP地址,但能查到com域的顶级域的IP地址,那么它便会将com域的顶级域的IP地址返回给运营商服务器,运营商服务器拿到后,会去询问com域的DNS服务器是否查的到www.baidu.com的IP地址,如果它查不到www.baidu.com的IP地址,但查的到baidu.com这个域的IP地址,那么它会将baidu.com域的IP地址返回给运营商服务器,运营商服务器拿到后,会去询问baidu.com域的DNS服务器(这个服务器一般域名注册商提供的,如万维网等)能否查到www.baidu.com的IP地址。一般到这个域的时候,只要是经过网站注册备案的,都能在这里查到(如果还没查到,那么就要进行其他的处理了)。查到之后就把www.baidu.com的IP地址返回给运营商DNS服务器,运营商DNS服务器拿到结果之后,会把这个结果返回给操作系统内核同时缓存(缓存的时间根据自己缓存时间长短来)起来,操作系统内核把结果返回给浏览器,浏览器最终就拿到了www.baidu.com对应的IP地址。

    4、通过DNS服务器解析后获得了网址的IP地址,浏览器就向域名对应的IP地址服务器发起TCP连接,即发起HTTP“三次握手”,即这个tcp连接请求要经过层层的路由设备到达服务器端以后进入到网卡,然后进入到内核的TCP/IP协议栈,还有可能要经过防火墙的过滤,最终到达Web服务端,然后建立起TCP/IP的连接。

    5、TCP/IP连接建立起来以后,浏览器就可以向服务器发送HTTP请求了;(例如GET请求一个根域里的一个域名地址,www.baidu.com

    6、服务器端接受到这个请求后,根据路径参数经过后端的一些处理后,把处理后的结果返回给浏览器;

    7、浏览器拿到了完整的HTML页面代码或者其他的数据结果后,浏览器开始下载HTML文档,同时设置缓存并关闭TCP连接。浏览器在解析和渲染这个页面的时候,里面的js,CSS,图片等静态资源也是一个个HTTP请求,都需要经过上述的几个主要步骤。

    8、浏览器根据拿到的资源对页面进行渲染,最终把一个完整的页面呈现给用户。(即浏览器对整个HTML结构进行解析,形成DOM树,同时对相应的CSS文件进行解析,形成CSS树,然后结合DOM树和CSS树形成一个绘制树。得到绘制树后,需要计算每个节点在页面中的位置,这个过程称为layout(布局)。layout的过程是在一个连续的二维平面上进行的,接下来需要将这些结果栅格化映射到屏幕的离散二维平面上,这一过程称为paint(着色)。现代浏览器为提升性能,将页面划分多个 layer,各自进行paint然后组合成一个页面(composite layers))。

    至此就完成了按下回车键时所经过的过程。

    四、过程中用到的协议以及作用

    1、域名解析用到DNS协议;
    2、DNS服务器是基于UDP的,因此会用到UDP协议;
    3、得到IP地址后,浏览器会与服务器建立HTTP连接,用到HTTP协议,如果用到了HTTPS协议还会对HTTP协议内容进行加密;
    4、http协议生成GET请求报文,将该报文传给TCP层处理,用到了TCP协议,TCP层若有需要会对HTTP数据报分片,分片依据路径MTU和MSS;
    5、TCP的数据报会发送给IP层,用到IP协议,IP层通过路由选择,将数据发送给目的端口;
    6、以太网协议需要知道目的IP地址的物理地址,需要用到ARP协议;

    五、用到了网络模型中的哪些层以及每一层的作用

    互联网中每个网络设备间的通信都必须遵守TCP/IP协议标准。利用TCP/IP进行通信时,会通过分层顺序与对端进行通信,发送数据会依次经过应用层,传输层,网络层,数据链路层,物理层。而接受数据的顺序刚好相反。如下图所示:

    各层数据包封装报头信息如下

    1、DNS协议,HTTP协议,HTTPS协议属于应用层
    应用层是体系结构中的最高层。应用层确定进程之间通信的性质以满足用户的需要。这里所说的进程就是指正在运行的程序。应用层不仅需要提供应用进程需要的信息交换,而且还要作为相互作用的应用进程的用户代理,来完成一些为进行语义上有意义的交换所必须的功能。

    2、TCP、UDP协议属于传输层
    传输层的任务就是负责主机中两个进程间的通信。因特网的传输层可使用两种不同的协议;即面向连接的传输控制协议TCP和无连接的用户数据报协议UDP。面向连接的服务能够提供可靠的交付,两种方式都各有其优点。

    3、IP协议和ARP协议属于网络层
    网络层负责为分组交换网上的不同主机提供通信。在发送数据时,网络层将传输层产生的报文段或用户数据报封装成分组或者包进行传送。在TCP/IP体系中,分组也叫作IP数据报。网络层的另一个任务就是选择合适的路由,使源主机传输层传下来的分组能够交付到目的主机。

    4、数据链路层
    当发送数据时,数据链路层的任务是将在网络层交下来的IP数据报组装成帧,在两个相邻节点间的链路上传送以帧为单位的数据。每一帧包括数据和必要的控制信息(如同步信息、地址信息、差错控制以及流量控制等信息)。控制信息使接收端能够知道一个帧从那个比特开始到那个比特结束。控制信息还使接收端能够检测到所收到的帧中有没有差错。

    5、物理层
    物理层的任务就是透明的传送比特流。在物理层上所传输的数据单位是比特。传递信息所利用的一些物理媒介,如双绞线、同轴电缆、光缆等,并不是在物理层之内而是在物理层的下面。因此也有人把物理媒体当做第0层。

    六、总结

    总的来说,当按下回车键时要经过DNS域名解析,将URL地址解析为ip地址,然后浏览器就向这个ip地址的服务器发起tcp连接,即tcp三次握手,连接成功后就服务器端进行处理,将处理结果返回给客户端,客户端将结果进行渲染,从而展示给用户,完成结束之后释放tcp连接,即四次挥手。

    七、参考博文

    (1) https://blog.csdn.net/Charles_Tian/article/details/80204526
    (2) https://blog.csdn.net/qq_41943585/java/article/details/102495684
    (3) https://blog.csdn.net/zgege/article/details/81587502
    (4) https://blog.csdn.net/qq_38950316/article/details/81087809

  • 相关阅读:
    TypeScript 基本数据类型
    TypeScript 一个面向对象的JavaScript
    Express 路由Router
    Node.js 自启动工具(supervisor 和 nodemon )
    Node.js Express WEB框架
    Node.js 文件操作
    Node.js回调函数和事件循环机制
    HashMap原理
    mybatis动态sql(常用)
    MySQL知识点
  • 原文地址:https://www.cnblogs.com/jasonboren/p/12116642.html
Copyright © 2020-2023  润新知