• HTTP协议


    前言

    超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准

    HTTP是一个基于TCP/IP通信协议来传输数据(HTML文件、图片文件、查询结果)

    HTTP协议工作于客户端-服务端架构为上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。Web服务器根据接收到的请求后,向客户端发送响应信息。(请求的数据往往比较小,而返回的数据往往比较大。因为返回的数据中包含了Body)

    HTTP是无状态的 FTP是有状态的

    为什么要学习http协议

    主要是为了方便后面openstack的搭建,因为openstack中各个组件间相互通信就是基于restful api的,restful api 可以理解为一个url地址 也就是http协议进行通信的

    用户是如何访问到浏览器中的文件呢?

    看下图

     HTTP1.1 与1.0的区别

      1.HTTP/1.0协议使用非持久连接,即在非持久连接下,一个tcp连接只传输一个Web对象,;
      2.HTTP/1.1默认使用持久连接(然而,HTTP/1.1协议的客户机和服务器可以配置成使用非持久连接)。

        在持久连接下,不必为每个Web对象的传送建立一个新的连接,一个连接中可以传输多个对象!

    URL与URI

      URL:(Unifrom/Universal Resource Locator)的缩写,即统一资源定位符

      URI:(Uniform Resource Identifier)的缩写,即统一资源标识符 (代表一种标准

      URL:协议名://域名:端口  如http://www.cnblogs.com:80/

      URI:协议名://域名:端口/路径   如http://www.cnblogs.com:80/index.html

    请求协议

    请求格式(即浏览器发给服务端的内容格式)

    http://host[:port][abs_path][空行][请求体]
    
    http:表示要通过http协议来定位网络资源
    
    host:表示合法的Internet主机域名或IP地址
    
    port:用于指定一个端口号,拥有被请求资源的服务器主机监听该端口的TCP连接(如果port为空,则使用缺省的端口80)当服务器的端口不是80时,需要指定端口号
    
    abs_path:指定请求资源的URI。
    
    空行:用来与请求体分隔开
    
    请求体:常用的就是GET或者POST(GET没有请求体,POST有请求体)

    浏览器发送请求到服务器的内容就是这个格式,如果不是这个格式服务器无法解读。

    GET请求:

      HTTP默认请求就是GET

      特点:

        没有请求体(GET不夹杂用户提交的信息,例如用户名密码之类的这种隐私的信息)

        请求数据必须在1K之内(socket协议规定)

        GET请求的数据会暴露在浏览器的地址栏中

      GET请求常用的操作

        浏览器地址栏直接给出URL地址,就是GET请求

        在页面上点击链接,也是一个GET请求

        提交表单(例如登录在前端中from就是表单的意思)的时候默认时候是GET,但也可以设置为POST。在提交数据的时候基本上都是POST

    实例

    www.zhihu.com

    Response:返回体(用户获取的页面)

    查看请求头信息

    点击view source查看源码 如下图

      1:GET请求。 “/” 代表要访问的页面。 http协议1.1

      2:Host访问的主机

      3:链接类型:长连接

      4:Upgrade-Insecure-Requests

      5:user-agent:user客户端一些简单信息

      6:accept:可以接收那些页面类型。(text/html、xml、image、等)

      7:accept-encoding:字符编码(让计算机识字符)这里代表的是压缩格式

      8:Accept-Language:支持的语言格式

      9:Cookie:一个cookie对应一个session

      10:If-Modified-Since:当客户端再次向服务器发起请求时并发送这个时间,服务器会根据自己的Last-Modified的时间对比,如果两者时间一样,那么浏览器会从本地提取缓存页面,大大缓解了服务器的性能

     以上就是请求过程,客户端请求结束后,服务端会返回两个东西(一个是Response页面,另一个是响应头Response Headers)

     查看响应头信息

    点击view source查看源码 如下图

      1:HTTP/1.1 200 ok  客户端收到http协议,返回状态码(请求成功)

      2:Content-Type:返回到客户端的数据类型(返回什么类型,用什么方式解析这个类型)

      3:Date:显示日期

      4:SWS:网站主页所使用的web服务

      5:Expires:缓存的过期时间

      6:Last-modified:上次页面修改的时间

      7:Content-Encoding:使用什么类型压缩Response内容

      8:Content-Length:页面大小(不包含图片视频等,只包含连接)

    以上就是响应头的简单介绍

    一般信息

      1:客户端请求的url地址

      2:请求类型

      3:状态码

      4:远程地址

    POST请求

       特点:

        1:数据不会出现在地址栏中

        2:数据大小没上线

        3:有请求体

        4:请求体中如果有中文,会使用URL编码

     实例

     1 <!DOCTYPE html>
     2 <html>
     3 <body>
     4 
     5 <form method="post">
     6 user:<br>
     7 <input type="text" name="username">
     8 <br>
     9 password:<br>
    10 <input type="text" name="password">
    11 <input type="submit" value="login">
    12 </form>
    13 
    14 </body>
    15 </html>
    16 
    17 #表单测试

    在pycharm中测试

     

      1 在地址栏中看到test.html是这个html文件

      2 页面后面的"?"代表着get请求

    如果默认请求是get方法的话在输入用户名与密码就会出现如下结果

    刚刚输入的用户名与密码打印到地址栏中了。这就是比较危险的了。但是如果设置为post请求就不会出现这种结果

    因此 post请求就不会将用户名与密码打印到地址栏中。而是浏览器帮你隐藏起来。在网页源码中的头信息中可以看到下面多了一个Form Data 这就是你提交上去的信息

    Referer:请求来自哪个页面那么如果在百度点击链接到这里,那么就是Referer://http:www.baidu.com;如果在浏览器中直接输入地址,则没有这个referer值(用于防盗链功能)

     

    状态码

        状态码的含义对于浏览器说很重要,返回不同的状态码有不同的含义。例如200表示响应成功,302,表示重定向等等

        200:请求成功

        3xx:重定向

          4xx:客户端错误(401访问被拒绝。403禁止访问。404未找到页面等)

        5xx:服务端错误(500内部服务器错误。503服务不可以。504网关超时等)

  • 相关阅读:
    软件包的作用
    Sqlserver2008 表分区教程
    C#通用类型转换 Convert.ChangeType
    缓存 HttpContext.Current.Cache和HttpRuntime.Cache的区别
    用户信息 Froms验证票证
    .NET4.0 __doPostBack未定义
    TFS2012 安装 配置笔记
    MVC学习笔记一
    新博客..第一天..
    ORACLE多表查询优化
  • 原文地址:https://www.cnblogs.com/charles1ee/p/6297815.html
Copyright © 2020-2023  润新知