HTTP协议

HTTP协议
前言

超文本传输协议（HTTP，HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准

HTTP是一个基于TCP/IP通信协议来传输数据（HTML文件、图片文件、查询结果）

HTTP协议工作于客户端-服务端架构为上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。Web服务器根据接收到的请求后，向客户端发送响应信息。（请求的数据往往比较小，而返回的数据往往比较大。因为返回的数据中包含了Body）

HTTP是无状态的 FTP是有状态的

为什么要学习http协议

主要是为了方便后面openstack的搭建，因为openstack中各个组件间相互通信就是基于restful api的，restful api 可以理解为一个url地址也就是http协议进行通信的

用户是如何访问到浏览器中的文件呢？

看下图

HTTP1.1 与1.0的区别

　　1.HTTP/1.0协议使用非持久连接,即在非持久连接下,一个tcp连接只传输一个Web对象,；
　　2.HTTP/1.1默认使用持久连接(然而,HTTP/1.1协议的客户机和服务器可以配置成使用非持久连接)。

　在持久连接下,不必为每个Web对象的传送建立一个新的连接,一个连接中可以传输多个对象!

URL与URI

　　URL：（Unifrom/Universal Resource Locator）的缩写，即统一资源定位符

　　URI：（Uniform Resource Identifier）的缩写，即统一资源标识符（代表一种标准）

　　URL：协议名://域名:端口　　如http://www.cnblogs.com:80/

　　URI：协议名://域名:端口/路径　　如http://www.cnblogs.com:80/index.html

请求协议

请求格式(即浏览器发给服务端的内容格式)
```
http://host[:port][abs_path][空行][请求体]

http：表示要通过http协议来定位网络资源

host：表示合法的Internet主机域名或IP地址

port：用于指定一个端口号，拥有被请求资源的服务器主机监听该端口的TCP连接（如果port为空，则使用缺省的端口80）当服务器的端口不是80时，需要指定端口号

abs_path：指定请求资源的URI。

空行：用来与请求体分隔开

请求体：常用的就是GET或者POST（GET没有请求体，POST有请求体）
```
浏览器发送请求到服务器的内容就是这个格式，如果不是这个格式服务器无法解读。

GET请求：

　　HTTP默认请求就是GET

　　特点：

　　　　没有请求体（GET不夹杂用户提交的信息，例如用户名密码之类的这种隐私的信息）

　　　　请求数据必须在1K之内（socket协议规定）

　　　　GET请求的数据会暴露在浏览器的地址栏中

　　GET请求常用的操作

　　　　浏览器地址栏直接给出URL地址，就是GET请求

　　　　在页面上点击链接，也是一个GET请求

　　　　提交表单（例如登录在前端中from就是表单的意思）的时候默认时候是GET，但也可以设置为POST。在提交数据的时候基本上都是POST

实例

www.zhihu.com

Response：返回体（用户获取的页面）

查看请求头信息

点击view source查看源码如下图

　　1：GET请求。 “/” 代表要访问的页面。 http协议1.1

　　2：Host访问的主机

　　3：链接类型：长连接

　　4：Upgrade-Insecure-Requests

　　5：user-agent：user客户端一些简单信息

　　6：accept：可以接收那些页面类型。（text/html、xml、image、等）

　　7：accept-encoding：字符编码（让计算机识字符）这里代表的是压缩格式

　　8：Accept-Language：支持的语言格式

　　9：Cookie：一个cookie对应一个session

　　10：If-Modified-Since:当客户端再次向服务器发起请求时并发送这个时间，服务器会根据自己的Last-Modified的时间对比，如果两者时间一样，那么浏览器会从本地提取缓存页面，大大缓解了服务器的性能

以上就是请求过程，客户端请求结束后，服务端会返回两个东西（一个是Response页面，另一个是响应头Response Headers）

查看响应头信息

点击view source查看源码如下图

　　1：HTTP/1.1 200 ok 客户端收到http协议，返回状态码（请求成功）

　　2：Content-Type：返回到客户端的数据类型（返回什么类型，用什么方式解析这个类型）

　　3：Date:显示日期

　　4：SWS:网站主页所使用的web服务

　　5：Expires：缓存的过期时间

　　6：Last-modified：上次页面修改的时间

　　7：Content-Encoding:使用什么类型压缩Response内容

　　8：Content-Length:页面大小（不包含图片视频等，只包含连接）

以上就是响应头的简单介绍

一般信息

　　1：客户端请求的url地址

　　2：请求类型

　　3：状态码

　　4：远程地址

POST请求

　　特点：

　　　　1：数据不会出现在地址栏中

　　　　2：数据大小没上线

　　　　3：有请求体

　　　　4：请求体中如果有中文，会使用URL编码

实例
```
 1 <!DOCTYPE html>
 2 <html>
 3 <body>
 4 
 5 <form method="post">
 6 user:<br>
 7 <input type="text" name="username">
 8 <br>
 9 password:<br>
10 <input type="text" name="password">
11 <input type="submit" value="login">
12 </form>
13 
14 </body>
15 </html>
16 
17 #表单测试
```
在pycharm中测试

　　1 在地址栏中看到test.html是这个html文件

　　2 页面后面的"?"代表着get请求

如果默认请求是get方法的话在输入用户名与密码就会出现如下结果

刚刚输入的用户名与密码打印到地址栏中了。这就是比较危险的了。但是如果设置为post请求就不会出现这种结果

因此 post请求就不会将用户名与密码打印到地址栏中。而是浏览器帮你隐藏起来。在网页源码中的头信息中可以看到下面多了一个Form Data 这就是你提交上去的信息

Referer：请求来自哪个页面那么如果在百度点击链接到这里，那么就是Referer：//http:www.baidu.com;如果在浏览器中直接输入地址，则没有这个referer值（用于防盗链功能）

状态码

　　　　状态码的含义对于浏览器说很重要，返回不同的状态码有不同的含义。例如200表示响应成功，302，表示重定向等等

　　　　200：请求成功

　　　　3xx：重定向

　　　 4xx：客户端错误（401访问被拒绝。403禁止访问。404未找到页面等）

　　　　5xx：服务端错误（500内部服务器错误。503服务不可以。504网关超时等）
相关阅读:
软件包的作用
 Sqlserver2008 表分区教程
 C#通用类型转换 Convert.ChangeType
缓存 HttpContext.Current.Cache和HttpRuntime.Cache的区别
 用户信息 Froms验证票证
 .NET4.0 __doPostBack未定义
 TFS2012 安装配置笔记
 MVC学习笔记一
 新博客..第一天..
ORACLE多表查询优化
原文地址：https://www.cnblogs.com/charles1ee/p/6297815.html

前言

为什么要学习http协议

HTTP1.1 与1.0的区别

URL与URI

请求协议

GET请求：

POST请求

状态码