HTTP协议教程

HTTP协议教程
文章内容：

1.HTTP协议概述

2.URL知识概述

3.HTTP消息结构详解

1.HTTP协议概述

定义：
- 超文本传送协议 (HTTP-Hypertext transfer protocol) 是分布式的超媒体系统应用之间的通信协议；是万维网（WWW）交换信息的基础。它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器；
- HTTP工作在TCP/IP协议体系中的TCP协议上；
- 现在WWW中使用的是HTTP/1.1，它是由RFCs(Requests for comments)在1990年6月制定。
特点：

简单快速：客户向服务器请求服务时，只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单，使得HTTP服务器的程序规模小，因而通信速度很快。
灵活：HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
无状态：HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息，则它必须重传。

HTTP传输步骤/过程：
- 建立TCP连接
- Web浏览器向Web服务器发送请求命令
- Web浏览器发送请求头信息
- Web服务器应答
- Web服务器发送应答头信息
- Web服务器向浏览器发送数据
- Web服务器关闭TCP连接/或者保持连接
2.URL概述

URL定义：
统一资源定位符（URL，英语 Uniform / Universal Resource Locator 的缩写）是用于完整地描述Internet上网页和其他资源的地址的一种标识方法。

URL格式：

基本格式如下
schema://host[:port#]/path/.../[?query-string][#anchor]
schema 协议(例如：http, https, ftp)
host 服务器的IP地址或者域名
port# 服务器的端口（如果是走协议默认端口，可省略）
path 访问资源的路径
query-string 参数，发送给http服务器的数据
anchor- 锚（跳转到网页的指定锚点位置）

一个URL 的例子 ：
http://www.website.com/test/test.aspx?name=sv&x=true#stuff

一个URL的请求过程：
- 当你在浏览器输入URL http://www.website.com 的时候，浏览器发送一个Request去获取 http://www. website.com的html. 服务器把Response发送回给浏览器.
- 浏览器分析Response中的 HTML，发现其中引用了很多其他文件，比如图片，CSS文件，JS文件。
- 浏览器会自动再次发送Request去获取图片，CSS文件，或者JS文件。
- 当所有的文件都下载成功后，网页就被显示出来了。
3.HTTP 消息结构

HTTP消息分为HTTP 请求消息(HTTP Request)和HTT响应(HTTP Response)消息。

HTTP 请求消息(HTTP Request)，由三部分组成：

第1部分叫Request line

第2部分叫Request header

第3部分是body（header和body之间有个空行）。

如下图所示：

HTTP请求消息示意图

HTTP请求消息示意图详细说明如下：
- METHOD：表示请求方法，比如POST、GET和PUT等;
- path-to-resoure ：表示请求的资源。
- Http/version-number :表示HTTP协议的版本号，如HTTP/1.1
- Request消息常用方法:Http定义了与服务器交互的不同方法，最基本的方法有4种，分别是GET，POST，PUT，DELETE，对应着对资源的查、改、增和删 4个操作。一般GET用于获取/查询资源信息，POST一般用于更新资源信息；这应该是GET和POST的本质区别；
Request消息之GET/POST示例：

GET实例：
```
GET /test/?id=11101&name=Professional HTTP/1.1 
Host: www.test.com 
User-Agent: Mozilla/5.0 (Windows; U;) Firefox/1.0.1 
Connection: Keep-Alive
```
POST 实例：
```
POST / HTTP/1.1 
Host: www.test.com  
User-Agent: Mozilla/5.0 (Windows; U) Firefox/1.0.1 
Content-Type: application/x-www-form-urlencoded 
Content-Length: 40 
Connection: Keep-Alive 
（…… 此处空一行 ……） 
name=Professional&id=11101
```
更多关于HTTP请求消息的知识要点：
- GET提交，请求的数据会附在URL之后（就是据放置在HTTP协议头中），以“?”分割URL
  输数据，多个参数用“&”连接；例如：
  login.action?name=tom&password=securiy
- POST提交：把提交的数据放置在是HTTP包的正文中。上文示例中name=Professional&id=11101就是实际的传输数据；
- 数据长度：HTTP协议没有对传输的数据和URL长度进行限制，但特定浏览器和服务器对URL长度有限制，因此对于GET提交时，传输数据就会受到URL长度的限制；由于POST操作不是通过URL传值，理论上数据长度不受限；
- 安全性：POST的安全性要比GET的安全性高，通过GET提交数据，用户名和密码将明文出现在URL上，容易被他人看到，URL信息也可能会被记录到历史纪录中；
HTTP 响应消息(HTTP Response)，由三部分组成：

第1部分叫Response line

第2部分叫Response header

第3部分是body（header和body之间有个空行）。

HTTP 响应消息示意图

HTTP响应消息示意图详细说明如下：
- HTTP/version-number：HTTP协议的版本号;
- status-code ：状态码
  1XX 提示信息 - 表示请求已被成功接收，继续处理
  2XX 成功 - 表示请求已被成功接收，理解，接受
  3XX 重定向 - 要完成请求必须进行更进一步的处理
  4XX 客户端错误 - 请求有语法错误或请求无法实现
  5XX 服务器端错误 - 服务器未能实现合法的请求
- message：状态消息
- 请求行最常用的状态码：
  200 (OK): 找到了该资源，并且一切正常。
  304 (NOT MODIFIED): 该资源在上次请求之后没有任何修改。这通常用于浏览器的缓存机制。
  401 (UNAUTHORIZED): 客户端无权访问该资源。这通常会使得浏览器要求用户输入用户名和密码，以登录到服务器。
  403 (FORBIDDEN): 客户端未能获得授权。这通常是在401之后输入了不正确的用户名或密码。
  404 (NOT FOUND): 在指定的位置不存在所申请的资源。
TO DO Next:

HTTP请求头(HTTP Request Header)

HTTP响应头(HTTP Request Header)

HTTP编码与解码(HTTP Encode/Decode)
相关阅读:
nginx重启失败的解决方法
 Linux开机禁用开启防火墙
 Linux查看系统版本信息的几种方法
 Linux修改时区的正确方法
 Linux中awk的gsub函数用法
 Linux 的mktemp 命令详解
 tomcat的简单概要小结
 {面试题8: 旋转数组的最小数字}
{面试题7: 使用两个队列实现一个栈}
{面试题7: 用两个栈实现队列}
原文地址：https://www.cnblogs.com/code123-cc/p/4859112.html

文章内容：

1.HTTP协议概述

2.URL概述

3.HTTP 消息结构