6.
HTTP协议的请求和响应报文中必定包含HTTP首部。
首部内容为客户端和服务器分别处理请求和响应提供所需要的信息。
报文首部由几个字段构成。
HTTP请求报文:
在请求报文中,HTTP报文由方法、URI、HTTP版本、HTTP首部字段等部分构成。
HTTP响应报文:
在响应中,HTTP报文由HTTP版本、状态码(数字和原因短语)、HTTP首部字段3部分构成。
HTTP首部字段:
HTTP首部字段是构成HTTP报文的要素之一。在客户端与服务器之间以HTTP协议进行通信的过程中,无论是请求还是响应都会使用首部字段,它能起到传递额外重要信息的作用。
使用首部字段是为了给浏览器和服务器提供报文主体大小、所使用的语言、认证信息等内容。
HTTP首部字段结构:
HTTP首部字段是由首部字段名和字段值构成的,中间用冒号“:”分隔。
首部字段名:字段值 如Content-Type:text/html
字段值对应单个HTTP首部字段可以有多个值,如:Keep-Alive:timeout=15,max=100
HTTP首部字段重复时为规范,由浏览器决定。
4种HTTP首部字段类型:
HTTP首部字段根据实际用途被分为以下4种类型。
通用首部字段:请求报文和响应报文两方都会使用的首部。
请求首部字段:从客户端向服务端发送请求报文时使用的首部。补充了附加信息、客户端信息、响应内容相关优先级等信息。
响应首部字段:从服务器端向客户端返回响应报文时使用的首部。补充了响应的附加内容,也会要求客户端附加额外的内容信息。
实体首部字段:
针对请求首部报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。
HTTP规范定义了如下47种首部字段。
通用首部字段:
通用首部字段名 | 说明 |
Cache-Control | 控制缓存的行为 |
Connection | 逐跳首部、连接的管理 |
Date | 创建报文的日期时间 |
Pragma | 报文指令 |
Tralier | 报文末端的首部字段一览 |
Transfer-Encoding | 指定报文主体的传输编码方式 |
Upgrade | 升级为其它协议 |
Via | 代理服务器的相关信息 |
Warning | 错误通知 |
请求首部字段:
请求首部字段名 | 说明 |
Accept | 用户代理可处理的媒体类型 |
Accept-Charset | 优先的字符集 |
Accept-Encoding | 优先的内容编码 |
Accept-Language | 优先的语言(自然语言) |
Authorization | Web认证信息 |
Expect | 期待服务器的特定行为 |
From | 用户的电子邮箱地址 |
Host | 请求资源所在服务器(一个IP可能对应多个服务器的虚拟主机) |
If-Match | 比较实体标记(ETag) |
If-Modifier-Since | 比较资源的更新时间 |
If-None-Match | 比较实体标记(与If-Match相反) |
If-Range | 资源未更新时发送实体Byte的范围请求 |
If-Unmodified-Since | 比较资源的更新时间(与If-Modified-Since相反) |
Max-Forwards | 最大传输逐跳数 |
Proxy-Authorization | 代理服务器要求客户端的认证信息 |
Range | 实体的字节范围请求 |
Referer | 对请求中URI的原始获取方 |
TE | 传输编码的优先级 |
User-Agent | HTTP客户端程序的信息 |
响应首部字段:
响应首部字段名 | 说明 |
Accept-Ranges | 是否接受字节范围请求 |
Age | 推算资源创建经过时间 |
ETag | 资源的匹配信息 |
Location | 令客户端重定向至指定URI |
Proxy-Authenticate | 代理服务器对客户端的认证信息 |
Retry-After | 对再次发起请求的时机要求 |
Server | HTTP服务器的安装信息 |
Vary | 代理服务器缓存的管理信息 |
WWW-Authenticate | 服务器对客户端的认证信息 |
实体首部字段:
实体首部字段 | 说明 |
Allow | 资源可支持的HTTP方法 |
Content-Encoding | 实体主体适用的编码方式 |
Content-Language | 实体主体的自然语言 |
Content-Length | 实体主体的大小(单位,字节) |
Content-Location | 替代对应资源的URI |
Content-MD5 | 实体主体的报文摘要 |
Content-Range | 实体主体的位置范围 |
Content-Type | 实体主体的媒体类型 |
Expires | 实体主体过期的日期时间 |
Last-Modified | 资源的最后修改日期时间 |
(Content-MD5字段的值:对报文主体执行MD5算法获得的128位二进制数,再通过BASE64编码后将结果写入Content-MD5字段值。服务器发送加密后的报文,客户端根据Content-MD5的值计算报文主体在传输过程中是否保持完整,以及确认传输到达。但有可能该字段的值在传输过程中就出错了。)
非HTTP/1.1首部字段:
使用率高的,如:Cookie、Set-Cookie和Content-Disposition等。
Set-Cookie字段:响应首部字段,开始状态管理所使用的Cookie信息。
Cookie字段:请求首部字段,服务器接收到的Cookie信息。
Set-Cookie属性:
NAME=VALUE,赋予Cookie的名称和其值(必须项)
expires=DATE,Cookie的有效期(若不明确指定则默认为浏览器关闭前为止)
path=PATH,将服务器上的文件目录作为Cookie的适用对象(若不指定则默认为文档所在的文件目录)
domain=域名,作为Cookie适用对象的域名(若不指定则默认为创建Cookie的服务器的域名)
Secure,仅在HTTPS安全通信时才会发送Cookie
HttpOnly,加以限制,使Cookie不能被Javascript脚本访问。
End-to-end首部和Hop-by-hop首部:
HTTP首部字段将定义成缓存代理和非缓存代理的行为。分为两种类型。
端到端首部:
此类别中的首部会转发给请求/响应对应的最终接收目标,且必须保存在由缓存生成的响应中,另外规定它必须被转发。
逐跳首部:
此类别中的首部只对单次转发有效,会因通过缓存或代理而不再转发。HTTP/1.1和之后版本中,如果要使用hop-by-hop首部,需提供Connection首部字段。
逐跳首部字段有8个:
Connection
Keep-Alive
Proxy-Authenticate
Proxy-Authorization
Tralier
TE
Transfer-Encoding
Upgrade
除了这8种逐跳首部字段外,剩下都是端到端首部。