深入web的请求过程

深入web的请求过程

一、深入web的请求过程

1.1、B/S网络架构概述

· 从前端到后端，都基于应用层协议HTTP来交互数据。一个请求就对应了一个操作，完成操作之后就断开了连接。基于这样的特点可以用来满足海量的用户的操作。这样的连接叫做短链接。

· 在浏览器中输入了一个链接，会发生的响应的步骤：

1、请求DNS将域名解析成相应的IP地址

2、通过IP找到对应的服务器

3、向这个服务器发起get请求

4、这个服务器返回默认的资源给用户使用的浏览器

·互联网上所有的资源都有一个URL。发布一个服务或者是一个资源道互联网上，一个自己的URL可以使网络上的用户访问到自己的资源或者是服务。

·必须基于HTTP与服务端交互。

·数据展示在浏览器中进行。获取数据之后，在浏览器上才能恢复出它原来的样子。

1.2、发起HTTP请求

·在网页中输入了一个URL然后按下回车键，就是发起了一个HTTP请求。

·不借助浏览器建立一个HTTP连接和建立一个Socket连接，然后写入的二进制数据必须符合HTTP的要求。

1、根据URL解析出的IP地址，和默认的80端口和远方的服务器建立Socket连接。

2、浏览器根据这个URL组装成一个get类型的HTTP请求头

3、通过outputStream.write发送到目标服务器，等待inputStream.read返回数据。

·发起一个HTTP请求，本质上就是建立一个Socket连接。

·HttpClient就是Java中处理HTTP请求的一个工具包。

有一个使用HttpClient的方法结构，在书本的 page.5 。

1.3、HTTP解析

·HTTP Header 掌握着互联网上成千上万的用户的数据的传输、用户浏览器的渲染行为、服务器的执行逻辑。在书本的 page.7 。

1.3.1使用浏览器自带的调试工具查看 HttpHeader

1.3.2浏览器的缓存机制

·浏览器会缓存一些之前打开这个页面的信息，在下一次打开的时候，可能会使用一些缓存的文件信息。 ·在使用F5刷新这个页面的时候，会在请求头中，加入一些信息，向服务器申明，需要最新的文件信息，而不是使用缓存的文件。

·追加的请求头是：Cache-Control：no-cache。

关于缓存的一些请求头：

1、Cache-Control：缓存控制，用来设置是否被缓存，以及怎么缓存。

2、Expires：缓存失效的时间，使用的是格林威治时间（GMT）。

3、Last-Modified/Etag：服务器上的资源最后一次更改的时间（GMT）。

4、If-Medified-Since：缓存的资源是不是最新的，如果是最新的，那么服务器就会返回一个304状态码，就不会返回新的数据。

5、Etag：使用编号来确定资源是不是新的。

1.4、DNS域名解析

1.4.1解析DNS域名的过程

域名解析，将域名解析成相应的IP地址

1、输入一个域名，浏览器会检查缓存中是否有这个域名的缓存。如果有，解析结束。

# 这个方法存在的弊端是缓存的时间不好掌握，使用TTL属性可以控制域名缓存的时间。

# 如果时间过长，域名和IP的变动，就会将用户带到错误的位置，如果太短会占用大量的解析时间。

2、如果浏览器的缓存中没有，就会在操作系统的缓存中寻找关于这个域名的信息。如果找到了，解析结束。

# 在Windows中，在C:WindowsSystem32driversetchosts文件中修改一个域名对应的IP。

# 也就是说可以将任意一个域名，通过对这个文件的修改，牵引到任意的IP地址。

3、如果上面的不走无法解决就会在真正的域名解析服务器中解析了。

# 第一个DNS解析的是：本地区域名服务器（LocalDNS）。这个域名解析服务器承担了大部分的域名解析工作。

# 它会缓存域名解析结果。

4、如果LDNS没有解决，就会到Root Server域名服务器，它会返回一个所查询的主域名服务器地址。

5、根据主服务器地址，会到全球只有13台的猪域名解析服务器（gTLD Server）进行解析。它们是全球顶级域名解析服务器。

6、LDNS向gTLD发送请求。

7、接受请求的gTLD服务器查找并返回这个域名对应的Name Server服务器地址。

#（可以理解为Name Server从gTLD中接受信息，解析出IP地址）

8、Name Server查找这个域名的IP，返回给Local DNS。

9、Local DNS 根据TTL值，缓存这个域名和IP的对应关系。

10、返回这个IP和TTL值给用户，并根据TTL值缓存在本地。

1.4.2跟踪域名解析的过程 | 在书本的 page.15 。

1.4.3清除缓存的域名

在本地（浏览器、操作系统）和LDNS会缓存域名和IP对应关系。

在书本的 page.18 。

1.4.4几种域名的解析方式

主要分为A记录、MX记录、CNAME记录、NS记录、TXT记录。

A记录：能将多个域名解析到桶一个IP地址。

MX记录：将某个域名下的邮件服务器解析到自己的Mail Server。

CNAME记录：为一个域名设置一个或者多个别名。

1.5、CDN的工作机制

CDN就是分布式网络(Content Delivery Network)。

CDN以缓存网站中的静态数据为主，例如CSS、JS、图片和HTML等数据。用户从主站服务器请求到动态内容了之后，再到CND中获取静态数据。从而加速网站的加载速度。

CDN要达到以下的目标：可扩展性、安全性、可靠性。

1.5.1 CDN的架构

首先向Local DNS服务器发起请求，经过迭代解析，然后回到这个域名的注册服务器去解析，在注册服务器，通过CNAME得到一个另外的域名。这个域名指向CDN中的均衡负载服务器，然后访问最近的CDN节点。

1.5.2均衡负载

均衡负载就是对工作量进行平衡，分摊到多个单元上执行，共同完成一个任务。提高了服务器的响应速度和利用率，解决了网络拥塞问题。

均衡负载架构的种类有：链路负载均衡、集群负载均衡、操作系统负载均衡。

链路负载均衡：负载均衡是指使用DNS的解析来实现的，用户最终访问哪个Web Server服务器由DNS Server来控制。

集群负载均衡又分为硬件负载均衡和软件负载均衡，其中

　　硬件负载均衡：使用使用设备，这样的设备很昂贵。

　　软件负载均衡：节约成本，但是一次访问请求要经过多次代理服务器，增加了网络负担。

操作系统负载均衡：利用操作系统级别的中断来实现负载均衡。

1.6、CDN的动态加速

CDN的动态加速：在CDN解析的过程中，通过动态的链路探测，来寻找最好的回源路径，通过调度DNS在将所有的请求在这条路径上回源。从而加快用户的访问效率。
相关阅读:
mysql 索引
 mysql binlog相关知识
 分布式系统日志
 学习路线
 分布式学习
 工具
 关于java面试
 mysql悲观锁总结和实践(转)
app技术博客整理
 Java编程一些经验
原文地址：https://www.cnblogs.com/zjxu97/p/10049455.html

热门文章
14
14序列化和文件的输入、输出
 13组件与容器
 12内部类
 12 图形用户接口
 11异常处理
 11 音频播放器
 10
8
9