• HTTP请求模型


    转自:http://blog.csdn.net/xiaojianpitt/article/details/4389247

    HTTP请求模型 

    一、连接至Web服务器

    一个客户端应用(如Web浏览器)打开到Web服务器的HTTP端口的一个套接字(缺省为80)。

    例如:http://www.myweb.com:8080/index.html
    在Java中,这将等同于代码:
    Soceet socket=new Socket("www.myweb.com",8080);
    InputStream in=socket.getInputStream();
    OutputStream out=socket.getOutputStream();

    二、发送HTTP请求
         通过连接,客户端写一个ASCII文本请求行,后跟0或多个HTTP头标,一个空行和实现请求的任意数据。

    一个请求由四个部分组成:请求行、请求头标、空行和请求数据

    1.请求行:请求行由三个标记组成:请求方法、请求URI和HTTP版本,它们用空格分隔。
    例如:GET /index.html HTTP/1.1

    HTTP规范定义了8种可能的请求方法:
    GET                 检索URI中标识资源的一个简单请求
    HEAD               与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
    POST                服务器接受被写入客户端输出流中的数据的请求
    PUT                 服务器保存请求数据作为指定URI新内容的请求
    DELETE            服务器删除URI中命名的资源的请求
    OPTIONS          关于服务器支持的请求方法信息的请求
    TRACE             Web服务器反馈Http请求和其头标的请求
    CONNECT        已文档化但当前未实现的一个方法,预留做隧道处理

    2.请求头标:由关键字/值对组成,每行一对,关键字和值用冒号(:)分隔。 请求头标通知服务器有关于客户端的功能和标识,典型的请求头标有:

    User-Agent        客户端厂家和版本
    Accept            客户端可识别的内容类型列表
    Content-Length    附加到请求的数据字节数

    3.空行:最后一个请求头标之后是一个空行,发送回车符和退行,通知服务器以下不再有头标。
    4.请求数据:使用POST传送数据,最常使用的是Content-Type和Content-Length头标。

    三、服务端接受请求并返回HTTP响应
    Web服务器解析请求,定位指定资源。服务器将资源副本写至套接字,在此处由客户端读取。

    一个响应由四个部分组成;状态行、响应头标、空行、响应数据

    1.状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述。
    HTTP版本:向客户端指明其可理解的最高版本。
    响应代码:3位的数字代码,指出请求的成功或失败,如果失败则指出原因。
    响应描述:为响应代码的可读性解释。
    例如:HTTP/1.1 200 OK

    HTTP响应码:
    1xx:信息,请求收到,继续处理
    2xx:成功,行为被成功地接受、理解和采纳
    3xx:重定向,为了完成请求,必须进一步执行的动作
    4xx:客户端错误:
    2.响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。
    3.空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。
    4.响应数据:HTML文档和图像等,也就是HTML本身。

    四、服务器关闭连接,浏览器解析响应
    1.浏览器首先解析状态行,查看表明请求是否成功的状态代码。
    2.然后解析每一个响应头标,头标告知以下为若干字节的HTML。
    3.读取响应数据HTML,根据HTML的语法和语义对其进行格式化,并在浏览器窗口中显示它。
    4.一个HTML文档可能包含其它需要被载入的资源引用,浏览器识别这些引用,对其它的资源再进行额外的请求,此过程循环多次。

    五、无状态连接
    HTTP模型是无状态的,表明在处理一个请求时,Web服务器并不记住来自同一客户端的请求。

    六、实例
    1.浏览器发出请求
    GET /index.html HTTP/1.1

    服务器返回响应:
    HTTP /1.1 200 OK
    Date: Apr 11 2006 15:32:08 GMT
    Server: Apache/2.0.46(win32)
    Content-Length: 119
    Content-Type: text/html

    <HTML>
    <HEAD>
    <LINK REL="stylesheet" HREF="index.css">
    </HEAD>
    <BODY>
    <IMG SRC="image/logo.png">
    </BODY>
    </HTML>

    2.浏览器发出请求
    GET /index.css HTTP/1.1

    服务器返回响应:
    HTTP /1.1 200 OK
    Date: Apr 11 2006 15:32:08 GMT
    Server: Apache/2.0.46(win32)
    Connection: Keep-alive, close
    Content-Length: 70
    Content-Type: text/plane

    h3{
        font-size:20px;
        font-weight:bold;
        color:#005A9C;
    }

    3.浏览器发出请求
    GET image/logo.png HTTP/1.1

    服务器返回响应:
    HTTP /1.1 200 OK
    Date: Apr 11 2006 15:32:08 GMT
    Server: Apache/2.0.46(win32)
    Connection: Keep-alive, close
    Content-Length: 1280
    Content-Type: text/plane

    {Binary image data follows}


    (附录)
    1.HTTP规范:Internet工程制定组织(IETF)发布的RFC指定Internet标准,这些RFC被Internet研究发展机构广泛接受。因为它们是标准文档,故一般用正规语言编写,如立法文标一样。

    2.RFC:RFC一旦被提出,就被编号且不会再改变,当一个标准被修改时,则给出一个新的RFC。作为标准,RFC在Internet上被广泛采用。

    3.HTTP的几个重要RFC:
        RFC1945    HTTP 1.0 描述
        RFC2068    HTTP 1.1 初步描述
        RFC2616    HTTP 1.1 标准
    4.资源标识符URI(Uniform Resource Identifter,URI)

    HTTP参考

    一、HTTP码应码
    响应码由三位十进制数字组成,它们出现在由HTTP服务器发送的响应的第一行。

    响应码分五种类型,由它们的第一位数字表示:
    1.1xx:信息,请求收到,继续处理
    2.2xx:成功,行为被成功地接受、理解和采纳
    3.3xx:重定向,为了完成请求,必须进一步执行的动作
    4.4xx:客户端错误,请求包含语法错误或者请求无法实现
    5.5xx:服务器错误,服务器不能实现一种明显无效的请求

    下表显示每个响应码及其含义:
    100            继续
    101            分组交换协
    200            OK
    201            被创建
    202            被采纳
    203            非授权信息
    204            无内容
    205            重置内容
    206            部分内容
    300            多选项
    301            永久地传送
    302            找到
    303            参见其他
    304            未改动
    305            使用代理
    307            暂时重定向
    400            错误请求
    401            未授权
    402            要求付费
    403            禁止
    404            未找到
    405            不允许的方法
    406            不被采纳
    407            要求代理授权
    408            请求超时
    409            冲突
    410            过期的
    411            要求的长度
    412            前提不成立
    413            请求实例太大
    414            请求URI太大
    415            不支持的媒体类型
    416            无法满足的请求范围
    417            失败的预期
    500            内部服务器错误
    501            未被使用
    502            网关错误
    503            不可用的服务
    504            网关超时
    505            HTTP版本未被支持

    二、HTTP头标
    头标由主键/值对组成。它们描述客户端或者服务器的属性、被传输的资源以及应该实现连接。

    四种不同类型的头标:
    1.通用头标:即可用于请求,也可用于响应,是作为一个整体而不是特定资源与事务相关联。
    2.请求头标:允许客户端传递关于自身的信息和希望的响应形式。
    3.响应头标:服务器和于传递自身信息的响应。
    4.实体头标:定义被传送资源的信息。即可用于请求,也可用于响应。

    头标格式:<name>:<value><CRLF>

    下表描述在HTTP/1.1中用到的头标
    Accept       定义客户端可以处理的媒体类型,按优先级排序;
                     在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept: image/jpeg,image/png,*/*
    Accept-Charset 
                     定义客户端可以处理的字符集,按优先级排序;
                     在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept-Charset: iso-8859-1,*,utf-8

    Accept-Encoding        定义客户端可以理解的编码机制。例如:Accept-Encoding:gzip,compress
    Accept-Language       定义客户端乐于接受的自然语言列表。例如:Accept-Language: en,de

    Accept-Ranges 
                 一个响应头标,它允许服务器指明:将在给定的偏移和长度处,为资源组成部分的接受请求。
                该头标的值被理解为请求范围的度量单位。例如Accept-Ranges: bytes或Accept-Ranges: nonea

    Age       允许服务器规定自服务器生成该响应以来所经过的时间长度,以秒为单位。
                该头标主要用于缓存响应。例如:Age: 30

    Allow            一个响应头标,它定义一个由位于请求URI中的次源所支持的HTTP方法列表。例如:Allow: GET,PUT

    aUTHORIZATION 
                一个响应头标,用于定义访问一种资源所必需的授权(域和被编码的用户ID与口令)。
                例如:Authorization: Basic YXV0aG9yOnBoaWw=

    Cache-Control        一个用于定义缓存指令的通用头标。例如:Cache-Control: max-age=30
    Connection           一个用于表明是否保存socket连接为开放的通用头标。例如:Connection: close或Connection: keep-alive

    Content-Base  
                一种定义基本URI的实体头标,为了在实体范围内解析相对URLs。
                如果没有定义Content-Base头标解析相对URLs,使用Content-Location URI(存在且绝对)或使用URI请求。
                例如:Content-Base: Http://www.myweb.com

    Content-Encoding    一种介质类型修饰符,标明一个实体是如何编码的。例如:Content-Encoding: zip
    Content-Language    用于指定在输入流中数据的自然语言类型。例如:Content-Language: en
    Content-Length        指定包含于请求或响应中数据的字节长度。例如:Content-Length:382

    Content-Location
                指定包含于请求或响应中的资源定位(URI)。
                如果是一绝。对URL它也作为被解析实体的相对URL的出发点。
                例如:Content-Location: http://www.myweb.com/news

    Content-MD5
                实体的一种MD5摘要,用作校验和。
                发送方和接受方都计算MD5摘要,接受方将其计算的值与此头标中传递的值进行比较。
                例如:Content-MD5: <base64 of 128 MD5 digest>

    Content-Range 
                随部分实体一同发送;标明被插入字节的低位与高位字节偏移,也标明此实体的总长度。
                例如:Content-Range: 1001-2000/5000

    Contern-Type        标明发送或者接收的实体的MIME类型。例如:Content-Type: text/html
    Date                    发送HTTP消息的日期。例如:Date: Mon,10PR 18:42:51 GMT

    ETag      一种实体头标,它向被发送的资源分派一个唯一的标识符。
                对于可以使用多种URL请求的资源,ETag可以用于确定实际被发送的资源是否为同一资源。
                例如:ETag: "208f-419e-30f8dc99"

    Expires          指定实体的有效期。例如:Expires: Mon,05 Dec 2008 12:00:00 GMT
    Form            一种请求头标,给定控制用户代理的人工用户的电子邮件地址。例如:From: webmaster@myweb.com
    Host            被请求资源的主机名。对于使用HTTP/1.1的请求而言,此域是强制性的。例如:Host: www.myweb.com

    If-Modified-Since   
                如果包含了GET请求,导致该请求条件性地依赖于资源上次修改日期。
                如果出现了此头标,并且自指定日期以来,此资源已被修改,应该反回一个304响应代码。
                例如:If-Modified-Since: Mon,10PR 18:42:51 GMT

    If-Match            如果包含于一个请求,指定一个或者多个实体标记。只发送其ETag与列表中标记区配的资源。
                           例如:If-Match: "208f-419e-308dc99"

    If-None-Match 
               如果包含一个请求,指定一个或者多个实体标记。资源的ETag不与列表中的任何一个条件匹配,操作才执行。
               例如:If-None-Match: "208f-419e-308dc99"

    If-Range
                指定资源的一个实体标记,客户端已经拥有此资源的一个拷贝。必须与Range头标一同使用。
                如果此实体自上次被客户端检索以来,还不曾修改过,那么服务器只发送指定的范围,否则它将发送整个资源。
                例如:Range: byte=0-499<CRLF>If-Range:"208f-419e-30f8dc99"

    If-Unmodified-Since
                只有自指定的日期以来,被请求的实体还不曾被修改过,才会返回此实体。
                例如:If-Unmodified-Since:Mon,10PR 18:42:51 GMT

    Last-Modified        指定被请求资源上次被修改的日期和时间。例如:Last-Modified: Mon,10PR 18:42:51 GMT
    Location 
                对于一个已经移动的资源,用于重定向请求者至另一个位置。
                与状态编码302(暂时移动)或者301(永久性移动)配合使用。
                例如:Location: http://www2.myweb.com/index.jsp

    Max-Forwards 
                一个用于TRACE方法的请求头标,以指定代理或网关的最大数目,该请求通过网关才得以路由。
                在通过请求传递之前,代理或网关应该减少此数目。例如:Max-Forwards: 3

    Pragma            一个通用头标,它发送实现相关的信息。例如:Pragma: no-cache
    Proxy-Authenticate
               类似于WWW-Authenticate,便是有意请求只来自请求链(代理)的下一个服务器的认证。
               例如:Proxy-Authenticate: Basic realm-admin

    Proxy-Proxy-Authorization
                类似于授权,但并非有意传递任何比在即时服务器链中更进一步的内容。
                例如:Proxy-Proxy-Authorization: Basic YXV0aG9yOnBoaWw=

    Public            列表显示服务器所支持的方法集。例如:Public: OPTIONS,MGET,MHEAD,GET,HEAD
    Range            指定一种度量单位和一个部分被请求资源的偏移范围。例如:Range: bytes=206-5513

    Refener
                一种请求头标域,标明产生请求的初始资源。对于HTML表单,它包含此表单的Web页面的地址。
                例如:Refener: http://www.myweb.com/news/search.html

    Retry-After 
               一种响应头标域,由服务器与状态编码503(无法提供服务)配合发送,以标明再次请求之前应该等待多长时间。
               此时间即可以是一种日期,也可以是一种秒单位。例如:Retry-After: 18

    Server                     一种标明Web服务器软件及其版本号的头标。例如:Server: Apache/2.0.46(Win32)
    Transfer-Encoding     一种通用头标,标明对应被接受方反向的消息体实施变换的类型。例如:Transfer-Encoding: chunked

    Upgrade 
                允许服务器指定一种新的协议或者新的协议版本,与响应编码101(切换协议)配合使用。
                例如:Upgrade: HTTP/2.0

    User-Agent
                定义用于产生请求的软件类型(典型的如Web浏览器)。
                例如:User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT; DigExt)

    Vary          一个响应头标,用于表示使用服务器驱动的协商从可用的响应表示中选择响应实体。例如:Vary: *
    Via            一个包含所有中间主机和协议的通用头标,用于满足请求。例如:Via: 1.0 fred.com, 1.1 wilma.com
    Warning    用于提供关于响应状态补充信息的响应头标。例如:Warning: 99 www.myweb.com Piano needs tuning

    www-Authenticate
                一个提示用户代理提供用户名和口令的响应头标,与状态编码401(未授权)配合使用。响应一个授权头标。
                例如:www-Authenticate: Basic realm=zxm.mgmt

    HTTP请求Header分析 - frank

    2007-12-27 17:21

    ·客户端HTTP请求的Header信息

    1、HTTP请求方式

    如下表:

    方 法

    描 述

    GET

    向Web服务器请求一个文件

    POST

    向Web服务器发送数据让Web服务器进行处理

    PUT

    向Web服务器发送数据并存储在Web服务器内部

    HEAD

    检查一个对象是否存在

    DELETE

    从Web服务器上删除一个文件

    CONNECT

    对通道提供支持

    TRACE

    跟踪到服务器的路径

    OPTIONS

    查询Web服务器的性能

    说明:

    主要使用到“GET”和“POST”。

    实例:

    POST /test/tupian/cm HTTP/1.1

    分成三部分:

    (1)POST:HTTP请求方式

    (2)/test/tupian/cm:请求Web服务器的目录地址(或者指令)

    (3)HTTP/1.1: URI(Uniform Resource Identifier,统一资源标识符)及其版本

    备注:

             在Ajax中,对应method属性设置。

    2、Host

    说明:

    请求的web服务器域名地址

    实例:

    例如web请求URL:http://zjm-forum-test10.zjm.baidu.com:8088/test/tupian/cm

    Host就为zjm-forum-test10.zjm.baidu.com:8088

    3、User-Agent

    说明:

    HTTP客户端运行的浏览器类型的详细信息。通过该头部信息,web服务器可以判断到当前HTTP请求的客户端浏览器类别。

    实例:

        User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11

    4、Accept

    说明:

    指定客户端能够接收的内容类型,内容类型中的先后次序表示客户端接收的先后次序。

    实例:

             例如:

    Accept:text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5

    备注:

    在Prototyp(1.5)的Ajax代码封装中,将Accept默认设置为“text/javascript, text/html, application/xml, text/xml, */*”。这是因为Ajax默认获取服务器返回的Json数据模式。

    在Ajax代码中,可以使用XMLHttpRequest 对象中setRequestHeader函数方法来动态设置这些Header信息。

    5、Accept-Language

    说明:

        指定HTTP客户端浏览器用来展示返回信息所优先选择的语言。

    实例:

    Accept-Language: zh-cn,zh;q=0.5

             这里默认为中文。

    6、Accept-Encoding

    说明:

             指定客户端浏览器可以支持的web服务器返回内容压缩编码类型。表示允许服务器在将输出内容发送到客户端以前进行压缩,以节约带宽。而这里设置的就是客户端浏览器所能够支持的返回压缩格式。

    实例:

             Accept-Encoding: gzip,deflate

    备注:

    其实在百度很多产品线中,apache在给客户端返回页面数据之前,将数据以gzip格式进行压缩。

    另外有关deflate压缩介绍:

    http://man.chinaunix.net/newsoft/ApacheMenual_CN_2.2new/mod/mod_deflate.html

    7、Accept-Charset

    说明:

             浏览器可以接受的字符编码集。

    实例:

             Accept-Charset: gb2312,utf-8;q=0.7,*;q=0.7

    8、Content-Type

    说明:

    显示此HTTP请求提交的内容类型。一般只有post提交时才需要设置该属性。

    实例:

             Content-type: application/x-www-form-urlencoded;charset:UTF-8

    有关Content-Type属性值可以如下两种编码类型:

    (1)“application/x-www-form-urlencoded”: 表单数据向服务器提交时所采用的编码类型,默认的缺省值就是“application/x-www-form-urlencoded”。 然而,在向服务器发送大量的文本、包含非ASCII字符的文本或二进制数据时这种编码方式效率很低。

    (2)“multipart/form-data”: 在文件上载时,所使用的编码类型应当是“multipart/form-data”,它既可以发送文本数据,也支持二进制数据上载。

    当提交为单单数据时,可以使用“application/x-www-form-urlencoded”;当提交的是文件时,就需要使用“multipart/form-data”编码类型。

    在Content-Type属性当中还是指定提交内容的charset字符编码。一般不进行设置,它只是告诉web服务器post提交的数据采用的何种字符编码。

             一般在开发过程,是由前端工程与后端UI工程师商量好使用什么字符编码格式来post提交的,然后后端ui工程师按照固定的字符编码来解析提交的数据。所以这里设置的charset没有多大作用。

    9、Connection

    说明:

    表示是否需要持久连接。如果web服务器端看到这里的值为“Keep-Alive”,或者看到请求使用的是HTTP 1.1(HTTP 1.1默认进行持久连接),它就可以利用持久连接的优点,当页面包含多个元素时(例如Applet,图片),显著地减少下载所需要的时间。要实现这一点,web服务器需要在返回给客户端HTTP头信息中发送一个Content-Length(返回信息正文的长度)头,最简单的实现方法是:先把内容写入ByteArrayOutputStream,然 后在正式写出内容之前计算它的大小。

    实例:

    Connection: keep-alive

    10、Keep-Alive

    说明:

             显示此HTTP连接的Keep-Alive时间。使客户端到服务器端的连接持续有效,当出现对服务器的后继请求时,Keep-Alive功能避免了建立或者重新建立连接。

             以前HTTP请求是一站式连接,从HTTP/1.1协议之后,就有了长连接,即在规定的Keep-Alive时间内,连接是不会断开的。

    实例:

    Keep-Alive: 300

    11、cookie

    说明:

             HTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器。

    12、Referer

    说明:

    包含一个URL,用户从该URL代表的页面出发访问当前请求的页面

    ·服务器端返回HTTP头部信息

    1、Content-Length

    说明:

             表示web服务器返回消息正文的长度

    2、Content-Type:

    说明:

             返回数据的类型(例如text/html文本类型)和字符编码格式。

    实例:

    Content-Type: text/html;charset=utf-8

    3、Date

    说明:

             显示当前的时间

  • 相关阅读:
    第二章 成员、变量和常量
    Roman To Integer
    Integer To Roman
    Container With Most Water
    搜狗2015前端工程师笔试题
    从网易与淘宝的font-size思考前端设计稿与工作流
    移动端web app自适应布局探索与总结
    CSS 常用代码
    利用 HTML 和 CSS 实现常见的布局
    CSS 尺寸单位
  • 原文地址:https://www.cnblogs.com/langke93/p/2285813.html
Copyright © 2020-2023  润新知