• LAMP(一)之http协议基础知识


    URI:Uniform Resource Identifier

      URL: Uniform Resource Locator,用于描述某服务器某特定资源的位置

      URN: Uniform Resource Nameing

    基本语法:
        <scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
          scheme:url方案
          <user>:<password> : 用户名密码
          <host>:<port> : 服务器地址 
            <path> : 资源路径
          params: 参数
            http://www.magedu.com/bbs/hello;gender=f
          query:
            http://www.magedu.com/bbs/item.php?username=tom&title=ab
          frag: # ....

    一次完整的http请求过程

            1. 建立或处理连接: 接收请求或拒绝请求
            2. 接收请求
                接收来自于网络的请求报文中对某资源的一次请求的过程
    
                并发访问响应模型 (Web I/O):
                    单线程I/O结构:启动一个进程处理用户请求,而且一次只处理一个:多个请求被串行响应
                    多线程I/O结构:并行启动多个线程,每个进程响应一个请求
                    复用I/O结构: 一个进程响应n个请求
                        多线程模型:一个进程生成N个线程,每个线程响应一个用户请求
                        事件驱动: event-driven
                    复用的多进程I/O结构:启动多个(m)进程,每个进程响应n个请求
    
            3. 处理请求:对请求报文进行解析,并获取请求的资源及请求方法等相关信息
    
                元数据:请求报文首部
                    <method> <URL> <VERSION>
                    Host:www.magedu.com    请求的主机名称
                    Connection:
    
            4.访问资源: 获取请求报文中请求的资源
    
                web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源;这些资源放置于本地文件系统某路径下,此路径通常称为DocRoot
    
                /var/www.html
                    images/1.jpg
    
                web服务器资源路径映射方式
                    a. docroot
                    b. alias
                    c. 虚拟主机docroot
                    d. 用户家目录docroot
    
            5. 构建响应报文
    
                资源的MIME类型
                    显示分类
                    魔法分类
                    协商分类
    
                URL重定向:
                    web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径
            6. 发送响应报文
            7. 记录日志

    http协议:hyper text transfer protocol (80/tcp)

        版本
           HTTP/0.9: 原型版本,简陋 HTTP/1.0: 第一个广泛使用的版本,引用了MIME机制,但是缓存机制比较简陋  
              MIME: Multipurpose Internet Mail Extension 多用途网络邮件扩展
       HTTP/1.1: 增强了缓存功能 HTTP/2.0:

      httpd协议:stateless, 服务器无法持续追踪访问来源, 基于cookie、session机制来追踪客户端的行为  

      http事务:一次请求(request)和一次响应(response)的过程  

       request报文
          <method><request-URL><version>  
          <headers>
    
          <entity-body>
       response报文
          <version><status><reason-phrase>  //version:HTTP/<major>.<minor>;status:三位数字标记请求处理过程中的情况;reason-phrase:状态码所标记的状态的简要描述
          <headers>  //每个请求或响应报文可包含任意个首部
         
         <entity-body>  //请求时附加的数据或响应时附加的数据
    method(方法)
        GET: 从服务器获取一个资源
        HEAD: 只从服务器获取文档的响应首部
        POST:向服务器发送要处理的数据
        PUT: 将请求的主体部分存储在服务器上
        DELETE: 请求删除服务器上指定的文档
        TRACE: 追踪请求到达服务器中间经过的代理服务器
        OPTIONS: 请求服务器返回对指定资源支持使用的请求方法
    status(状态码)
        1XX: 100-101,信息提示
        2XX: 200-206, 成功类信息
        3XX:300-305, 重定向,提示需进一步提供补充类信息的状态码
        4XX: 400-415,客户端错误
        5XX: 500-505,服务器端错误
        
        常用的状态码:
            200:成功,请求的所有数据通过响应报文的entity-body部分发送:OK
            301: 请求的url指向的资源已经被删除;但在响应报文中通过首部location指明了资源现在所处的位置,永久重定向
            302: 与301相似,但在响应报文中通过location指明了资源现在所处的临时位置
            304:客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此状态码通知客户端,not modify
            401: 需要输入账号和密码认证方能访问资源:unauthorized
            403: 请求被禁止,forbidden
            404: 服务器无法找到客户端请求的资源,not found
            500: 服务器内部错误: internal server error
            502: 代理服务器从后端服务器收到了一条伪响应,bad gateway

    header

      格式:

        Name : Value

      首部分类:

         通用首部
        请求首部
        响应首部
        实体首部
        扩展首部
    通用首部:
                              Date: 报文的创建时间
                              connection: 连接方式,如keep-alive,close
                              via: 显示报文经过的中间节点
                              cache-control:控制缓存
                              pragma:
    请求首部:
                            accept: 通过服务器自己可接受的媒体类型
                            accept-charset:
                            accept-encoding: 接受编码格式,如gzip
                            accept-language: 接受的语言
    
                            client-IP:客户端IP
                            Host: 请求的服务器名称和端口号
                            Referer: 包含当前正在请求的资源的上一级资源
                            User-Agent: 客户端代理
    
                            条件式请求首部
                                expect:期望发什么信息
                                if-modify-since: 自从指定的时间之后,请求的资源是否发生修改过
                                if-unmodified-since: 自从指定的时间之后,请求的资源是否没有修改
                                if-none-match: 本地缓存中存储的文档的etag标签是否与服务器文档的etag不匹配
                                if-match:本地缓存中存储的文档的扩展标签etag是否与服务器文档的etag匹配
    
                            安全请求首部:
                                authorization: 向服务器发送认证信息,如账号和密码
                                cookie: 客户端向服务器端发送cookie
                                cookie2
    
                            代理请求首部:
                                proxy-authorization:向代理服务器认证
    响应首部:
                            信息性:
                                age: 响应持续时长
                                server:服务器程序软件名称和版本
    
                            协商首部:某资源有多种表示方法时使用
                                accept-ranges: 服务器可接受的请求范围类型
                                vary: 服务器查看的其他首部列表
    
                            安全响应首部
                                set-cookie: 向客户端设置cookie
                                set-cookie2:向客户端设置第二版的cookie
                                www-authenticate: 来自服务器的对客户端的质询认证表单
    实体首部:
                            allow: 列出对此实体可使用的请求方法
                            location: 告诉客户端真正的实体位于何处,重定向时使用
    
                            content-encoding:内容的编码格式
                            content-language:内容的语言
                            content-length: 主体的长度
                            content-location: 实体真正所处位置
                            content-type: 主体的对象类型
    
                            缓存相关
                                eTag: 实体的扩展标签
                                expires: 实体的过期时间
                                last-Modified: 最后一次修改的时间

     协议查看或分析的工具:

    tcpdump, tshark, wireshark
  • 相关阅读:
    关于调试 SharePoint 2010 中的爬网问题的疑难解答提示
    JS 获取 本周、本月、本季度、本年、上月、上周、上季度、去年
    jqGrid动态列
    【原创】博客“缘”
    讀取內部網站8/22
    開啟VS2005速度慢8/25
    仲秋節快樂
    外部表不是預期的格式8/28
    要考試10/17
    DataTable導入Excel 8/27
  • 原文地址:https://www.cnblogs.com/ckh2014/p/10789733.html
Copyright © 2020-2023  润新知