URI:Uniform Resource Identifier
URL: Uniform Resource Locator,用于描述某服务器某特定资源的位置
URN: Uniform Resource Nameing
基本语法:
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
scheme:url方案
<user>:<password> : 用户名密码
<host>:<port> : 服务器地址
<path> : 资源路径
params: 参数
http://www.magedu.com/bbs/hello;gender=f
query:
http://www.magedu.com/bbs/item.php?username=tom&title=ab
frag: # ....
一次完整的http请求过程
1. 建立或处理连接: 接收请求或拒绝请求
2. 接收请求
接收来自于网络的请求报文中对某资源的一次请求的过程
并发访问响应模型 (Web I/O):
单线程I/O结构:启动一个进程处理用户请求,而且一次只处理一个:多个请求被串行响应
多线程I/O结构:并行启动多个线程,每个进程响应一个请求
复用I/O结构: 一个进程响应n个请求
多线程模型:一个进程生成N个线程,每个线程响应一个用户请求
事件驱动: event-driven
复用的多进程I/O结构:启动多个(m)进程,每个进程响应n个请求
3. 处理请求:对请求报文进行解析,并获取请求的资源及请求方法等相关信息
元数据:请求报文首部
<method> <URL> <VERSION>
Host:www.magedu.com 请求的主机名称
Connection:
4.访问资源: 获取请求报文中请求的资源
web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源;这些资源放置于本地文件系统某路径下,此路径通常称为DocRoot
/var/www.html
images/1.jpg
web服务器资源路径映射方式
a. docroot
b. alias
c. 虚拟主机docroot
d. 用户家目录docroot
5. 构建响应报文
资源的MIME类型
显示分类
魔法分类
协商分类
URL重定向:
web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径
6. 发送响应报文
7. 记录日志
http协议:hyper text transfer protocol (80/tcp)
版本
HTTP/0.9: 原型版本,简陋 HTTP/1.0: 第一个广泛使用的版本,引用了MIME机制,但是缓存机制比较简陋
MIME: Multipurpose Internet Mail Extension 多用途网络邮件扩展
HTTP/1.1: 增强了缓存功能 HTTP/2.0:
httpd协议:stateless, 服务器无法持续追踪访问来源, 基于cookie、session机制来追踪客户端的行为
http事务:一次请求(request)和一次响应(response)的过程
request报文
<method><request-URL><version>
<headers>
<entity-body>
response报文
<version><status><reason-phrase> //version:HTTP/<major>.<minor>;status:三位数字标记请求处理过程中的情况;reason-phrase:状态码所标记的状态的简要描述
<headers> //每个请求或响应报文可包含任意个首部
<entity-body> //请求时附加的数据或响应时附加的数据
method(方法)
GET: 从服务器获取一个资源
HEAD: 只从服务器获取文档的响应首部
POST:向服务器发送要处理的数据
PUT: 将请求的主体部分存储在服务器上
DELETE: 请求删除服务器上指定的文档
TRACE: 追踪请求到达服务器中间经过的代理服务器
OPTIONS: 请求服务器返回对指定资源支持使用的请求方法
status(状态码)
1XX: 100-101,信息提示
2XX: 200-206, 成功类信息
3XX:300-305, 重定向,提示需进一步提供补充类信息的状态码
4XX: 400-415,客户端错误
5XX: 500-505,服务器端错误
常用的状态码:
200:成功,请求的所有数据通过响应报文的entity-body部分发送:OK
301: 请求的url指向的资源已经被删除;但在响应报文中通过首部location指明了资源现在所处的位置,永久重定向
302: 与301相似,但在响应报文中通过location指明了资源现在所处的临时位置
304:客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此状态码通知客户端,not modify
401: 需要输入账号和密码认证方能访问资源:unauthorized
403: 请求被禁止,forbidden
404: 服务器无法找到客户端请求的资源,not found
500: 服务器内部错误: internal server error
502: 代理服务器从后端服务器收到了一条伪响应,bad gateway
header
格式:
Name : Value
首部分类:
通用首部
请求首部
响应首部
实体首部
扩展首部
通用首部:
Date: 报文的创建时间
connection: 连接方式,如keep-alive,close
via: 显示报文经过的中间节点
cache-control:控制缓存
pragma:
请求首部:
accept: 通过服务器自己可接受的媒体类型
accept-charset:
accept-encoding: 接受编码格式,如gzip
accept-language: 接受的语言
client-IP:客户端IP
Host: 请求的服务器名称和端口号
Referer: 包含当前正在请求的资源的上一级资源
User-Agent: 客户端代理
条件式请求首部
expect:期望发什么信息
if-modify-since: 自从指定的时间之后,请求的资源是否发生修改过
if-unmodified-since: 自从指定的时间之后,请求的资源是否没有修改
if-none-match: 本地缓存中存储的文档的etag标签是否与服务器文档的etag不匹配
if-match:本地缓存中存储的文档的扩展标签etag是否与服务器文档的etag匹配
安全请求首部:
authorization: 向服务器发送认证信息,如账号和密码
cookie: 客户端向服务器端发送cookie
cookie2
代理请求首部:
proxy-authorization:向代理服务器认证
响应首部:
信息性:
age: 响应持续时长
server:服务器程序软件名称和版本
协商首部:某资源有多种表示方法时使用
accept-ranges: 服务器可接受的请求范围类型
vary: 服务器查看的其他首部列表
安全响应首部
set-cookie: 向客户端设置cookie
set-cookie2:向客户端设置第二版的cookie
www-authenticate: 来自服务器的对客户端的质询认证表单
实体首部:
allow: 列出对此实体可使用的请求方法
location: 告诉客户端真正的实体位于何处,重定向时使用
content-encoding:内容的编码格式
content-language:内容的语言
content-length: 主体的长度
content-location: 实体真正所处位置
content-type: 主体的对象类型
缓存相关
eTag: 实体的扩展标签
expires: 实体的过期时间
last-Modified: 最后一次修改的时间
协议查看或分析的工具:
tcpdump, tshark, wireshark