• 深入web的请求过程


    一、深入web的请求过程

    1.1、B/S网络架构概述

    · 从前端到后端,都基于应用层协议HTTP来交互数据。一个请求就对应了一个操作,完成操作之后就断开了连接。基于这样的特点可以用来满足海量的用户的操作。这样的连接叫做短链接。

    · 在浏览器中输入了一个链接,会发生的响应的步骤:

    1、请求DNS将域名解析成相应的IP地址

    2、通过IP找到对应的服务器

    3、向这个服务器发起get请求

    4、这个服务器返回默认的资源给用户使用的浏览器

    ·互联网上所有的资源都有一个URL。发布一个服务或者是一个资源道互联网上,一个自己的URL可以使网络上的用户访问到自己的资源或者是服务。

    ·必须基于HTTP与服务端交互。

    ·数据展示在浏览器中进行。获取数据之后,在浏览器上才能恢复出它原来的样子。

    1.2、发起HTTP请求

    ·在网页中输入了一个URL然后按下回车键,就是发起了一个HTTP请求。

    ·不借助浏览器建立一个HTTP连接和建立一个Socket连接,然后写入的二进制数据必须符合HTTP的要求。

    1、根据URL解析出的IP地址,和默认的80端口和远方的服务器建立Socket连接。

    2、浏览器根据这个URL组装成一个get类型的HTTP请求头

    3、通过outputStream.write发送到目标服务器,等待inputStream.read返回数据。

    ·发起一个HTTP请求,本质上就是建立一个Socket连接。

    ·HttpClient就是Java中处理HTTP请求的一个工具包。

    有一个使用HttpClient的方法结构,在书本的 page.5 。

    1.3、HTTP解析

    ·HTTP Header 掌握着互联网上成千上万的用户的数据的传输、用户浏览器的渲染行为、服务器的执行逻辑。在书本的 page.7 。

      1.3.1使用浏览器自带的调试工具查看 HttpHeader

      1.3.2浏览器的缓存机制

    ·浏览器会缓存一些之前打开这个页面的信息,在下一次打开的时候,可能会使用一些缓存的文件信息。 ·在使用F5刷新这个页面的时候,会在请求头中,加入一些信息,向服务器申明,需要最新的文件信息,而不是使用缓存的文件。

    ·追加的请求头是:Cache-Control:no-cache。

    关于缓存的一些请求头:

    1、Cache-Control:缓存控制,用来设置是否被缓存,以及怎么缓存。

    2、Expires:缓存失效的时间,使用的是格林威治时间(GMT)。

    3、Last-Modified/Etag:服务器上的资源最后一次更改的时间(GMT)。

    4、If-Medified-Since:缓存的资源是不是最新的,如果是最新的,那么服务器就会返回一个304状态码,就不会返回新的数据。

    5、Etag:使用编号来确定资源是不是新的。

    1.4、DNS域名解析

    1.4.1解析DNS域名的过程

    域名解析,将域名解析成相应的IP地址

    1、输入一个域名,浏览器会检查缓存中是否有这个域名的缓存。如果有,解析结束。

    # 这个方法存在的弊端是缓存的时间不好掌握,使用TTL属性可以控制域名缓存的时间。

    # 如果时间过长,域名和IP的变动,就会将用户带到错误的位置,如果太短会占用大量的解析时间。

    2、如果浏览器的缓存中没有,就会在操作系统的缓存中寻找关于这个域名的信息。如果找到了,解析结束。

    # 在Windows中,在C:WindowsSystem32driversetchosts文件中修改一个域名对应的IP。

    # 也就是说可以将任意一个域名,通过对这个文件的修改,牵引到任意的IP地址。

    3、如果上面的不走无法解决就会在真正的域名解析服务器中解析了。

    # 第一个DNS解析的是:本地区域名服务器(LocalDNS)。这个域名解析服务器承担了大部分的域名解析工作。

    # 它会缓存域名解析结果。

    4、如果LDNS没有解决,就会到Root Server域名服务器,它会返回一个所查询的主域名服务器地址。

    5、根据主服务器地址,会到全球只有13台的猪域名解析服务器(gTLD Server)进行解析。它们是全球顶级域名解析服务器。

    6、LDNS向gTLD发送请求。

    7、接受请求的gTLD服务器查找并返回这个域名对应的Name Server服务器地址。

    #(可以理解为Name Server从gTLD中接受信息,解析出IP地址)

    8、Name Server查找这个域名的IP,返回给Local DNS。

    9、Local DNS 根据TTL值,缓存这个域名和IP的对应关系。

    10、返回这个IP和TTL值给用户,并根据TTL值缓存在本地。

    1.4.2跟踪域名解析的过程 | 在书本的 page.15 。

    1.4.3清除缓存的域名

    在本地(浏览器、操作系统)和LDNS会缓存域名和IP对应关系。

    在书本的 page.18 。 

    1.4.4几种域名的解析方式

    主要分为A记录、MX记录、CNAME记录、NS记录、TXT记录。

    A记录:能将多个域名解析到桶一个IP地址。

    MX记录:将某个域名下的邮件服务器解析到自己的Mail Server。

    CNAME记录:为一个域名设置一个或者多个别名。

    1.5、CDN的工作机制

    CDN就是分布式网络(Content Delivery Network)。

    CDN以缓存网站中的静态数据为主,例如CSS、JS、图片和HTML等数据。用户从主站服务器请求到动态内容了之后,再到CND中获取静态数据。从而加速网站的加载速度。

    CDN要达到以下的目标:可扩展性、安全性、可靠性。

    1.5.1 CDN的架构

    首先向Local DNS服务器发起请求,经过迭代解析,然后回到这个域名的注册服务器去解析,在注册服务器,通过CNAME得到一个另外的域名。这个域名指向CDN中的均衡负载服务器,然后访问最近的CDN节点。

    1.5.2均衡负载

      均衡负载就是对工作量进行平衡,分摊到多个单元上执行,共同完成一个任务。提高了服务器的响应速度和利用率,解决了网络拥塞问题。

    均衡负载架构的种类有:链路负载均衡、集群负载均衡、操作系统负载均衡。

    链路负载均衡:负载均衡是指使用DNS的解析来实现的,用户最终访问哪个Web Server服务器由DNS Server来控制。

    集群负载均衡又分为硬件负载均衡和软件负载均衡,其中

      硬件负载均衡:使用使用设备,这样的设备很昂贵。

      软件负载均衡:节约成本,但是一次访问请求要经过多次代理服务器,增加了网络负担。

    操作系统负载均衡:利用操作系统级别的中断来实现负载均衡。

    1.6、CDN的动态加速

    CDN的动态加速:在CDN解析的过程中,通过动态的链路探测,来寻找最好的回源路径,通过调度DNS在将所有的请求在这条路径上回源。从而加快用户的访问效率。

  • 相关阅读:
    mysql 索引
    mysql binlog相关知识
    分布式系统日志
    学习路线
    分布式学习
    工具
    关于java面试
    mysql悲观锁总结和实践(转)
    app技术博客整理
    Java编程一些经验
  • 原文地址:https://www.cnblogs.com/zjxu97/p/10049455.html
Copyright © 2020-2023  润新知