浏览器输入URL到响应页面的全过程

浏览器输入URL到响应页面的全过程
B/S网络架构从前端到后端都得到了简化，都基于统一的应用层协议HTTP来交互数据，HTTP协议采用无状态的短链接的通信方式，通常情况下，一次请求就完成了一次数据交互，通常也对应一个业务逻辑，然后这次通信连接就断开了。采用这种方式是为了能够同时服务更多的用户，因为当前互联网应用每天都会处理上亿的用户请求，不可能每个用户访问一次后就一直保持住这个连接。

①输入URL：www.google.com；

②DNS域名解析：域名与IP映射（发送到DNS(域名服务器)获得域名对应的WEB服务器的IP地址）；

③建立TCP连接：客户端浏览器与WEB服务器建立TCP(传输控制协议)连接，三次握手；

④发送Http Request：请求信息（客户端浏览器向对应IP地址的WEB服务器发送相应的HTTP或HTTPS请求）；

⑤WEB服务器：Nginx反向代理（客户端本来可以直接通过HTTP协议访问某网站应用服务器，网站管理员可以在中间加上一个Nginx，客户端请求Nginx，Nginx请求应用服务器，然后将结果返回给客户端，此时Nginx就是反向代理服务器）；

⑥应用服务器：Server处理请求（数据库等交互.....）；

⑦用户浏览器：渲染响应页面（客户端浏览器下载数据，解析HTML源文件，解析的过程中实现对页面的排版，解析完成后，在浏览器中显示基础的页面）；

⑧关闭TCP连接：响应完成（非持久连接）；

一句话概括：浏览器本身是一个客户端，当你输入URL的时候，首先浏览器会去请求DNS服务器，通过DNS获取相应的域名对应的IP，然后通过IP地址找到IP对应的服务器后，要求建立TCP连接，等浏览器发送完HTTP Request（请求）包后，服务器接收到请求包之后才开始处理请求包，服务器调用自身服务，返回HTTP Response（响应）包；客户端收到来自服务器的响应后开始渲染这个Response包里的主体（body），等收到全部的内容随后断开与该服务器之间的TCP连接；

一些具体详细的补充：

浏览器是怎么查找域名对应的IP地址的？

1) 请求一旦发起，浏览器首先要做的事情就是解析这个域名，一般来说，浏览器会首先查看本地硬盘的 hosts 文件，看看其中有没有和这个域名对应的规则，如果有的话就直接使用 hosts 文件里面的 ip 地址。
2) 如果在本地的 hosts 文件没有能够找到对应的 ip 地址，浏览器会发出一个 DNS请求到本地DNS服务器。本地DNS服务器一般都是你的网络接入服务器商提供，比如中国电信，中国移动。
3) 查询你输入的网址的DNS请求到达本地DNS服务器之后，本地DNS服务器会首先查询它的缓存记录，如果缓存中有此条记录，就可以直接返回结果，此过程是递归的方式进行查询。如果没有，本地DNS服务器还要向DNS根服务器进行查询。
4) 根DNS服务器没有记录具体的域名和IP地址的对应关系，而是告诉本地DNS服务器，你可以到域服务器上去继续查询，并给出域服务器的地址。
5) 本地DNS服务器继续向域服务器发出请求，在这个例子中，请求的对象是.com域服务器。.com域服务器收到请求之后，也不会直接返回域名和IP地址的对应关系，而是告诉本地DNS服务器，你的域名的解析服务器的地址。
6) 最后，本地DNS服务器向域名的解析服务器发出请求，这时就能收到一个域名和IP地址对应关系，本地DNS服务器不仅要把IP地址返回给用户电脑，还要把这个对应关系保存在缓存中，以备下次别的用户查询时，可以直接返回结果，加快网络访问。

浏览器向 web 服务器发送一个 HTTP 请求的过程大概是？

拿到域名对应的IP地址之后，浏览器会以一个随机端口（1024<端口<65535）向服务器的WEB程序（常用的有httpd,nginx等）80端口发起TCP的连接请求。这个连接请求到达服务器端后（这中间通过各种路由设备，局域网内除外），进入到网卡，然后是进入到内核的TCP/IP协议栈（用于识别该连接请求，解封包，一层一层的剥开），还有可能要经过Netfilter防火墙（属于内核的模块）的过滤，最终到达WEB程序，最终建立了TCP/IP的连接。
建立了TCP连接之后，发起一个http请求。一个典型的 http request header 一般需要包括请求的方法，例如 GET 或者 POST 等，不常用的还有 PUT 和 DELETE 、HEAD、OPTION以及 TRACE 方法，一般的浏览器只能发起 GET 或者 POST 请求。

客户端向服务器发起http请求的时候，会有一些请求信息，请求信息包含三个部分：
-------请求方法URI协议/版本
-------请求头(Request Header)
-------请求正文：

GET/sample.php
HTTP/1.1 Accept:image/gif.image/jpeg,*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
Accept-Encoding:gzip,deflate

username=jinqiao&password=1234
注意：最后一个请求头之后是一个空行，发送回车符和换行符，通知服务器以下不再有请求头。

服务器是如何处理请求的呢？

后端从在固定的端口接收到TCP报文开始，它会对TCP连接进行处理，对HTTP协议进行解析，并按照报文格式进一步封装成HTTP Request对象，供上层使用。
一些大一点的网站会将你的请求到反向代理服务器中，因为当网站访问量非常大，网站越来越慢，一台服务器已经不够用了。于是将同一个应用部署在多台服务器上，将大量用户的请求分配给多台机器处理。此时，客户端不是直接通过HTTP协议访问某网站应用服务器，而是先请求到Nginx，Nginx再请求应用服务器，然后将结果返回给客户端，这里Nginx的作用是反向代理服务器。同时也带来了一个好处，其中一台服务器万一挂了，只要还有其他服务器正常运行，就不会影响用户使用。
通过Nginx的反向代理，我们到达了web服务器，服务端脚本处理我们的请求，访问我们的数据库，获取需要获取的内容。

服务器返回一个 HTTP 响应大概包括哪些？

HTTP响应与HTTP请求相似，HTTP响应也由3个部分构成，分别是：
----- 状态行
----- 响应头(Response Header)
----- 响应正文
```
HTTP/1.1 200 OK 
Date: Sat, 31 Dec 2005 23:59:59 GMT 
Content-Type: text/html;charset=ISO-8859-1 Content-Length: 122 
＜html＞ 
＜head＞ 
＜title＞http＜/title＞ 
＜/head＞ 
＜body＞ 
＜!-- body goes here --＞ 
＜/body＞ 
＜/html＞
```
相关阅读:
操作系统进程（下）
操作系统进程（上）
进程的执行状态
 操作系统之内存与进程
 阿里巴巴一道笔试题
 ASP.NET 验证码不同浏览器不刷新问题
 Android常用控件之GridView使用BaseAdapter
spoj 8222 Substrings (后缀自动机)
【每天一个Linux命令】13. Linux中whereis命令的用法
 JSP 文件上传下载系列之二[Commons fileUpload]
原文地址：https://www.cnblogs.com/wt645631686/p/7561466.html