第五章:与HTTP协作的Web服务器
一台Web服务器可以搭建多个独立域名的Web网站,也可以作为通信路径上的中转服务器提升传输效率。
1.用单台虚拟主机实现多个域名
即使物理层面只有一台服务器,但只要使用虚拟主机的功能,则可以假想已经具有多台服务器。客户端使用HTTP协议访问服务器时,会经常采用类似www.hacker.jp这样的主机名和域名。在互联网上,域名通过DNS服务映射到IP地址之后访问目标网站,可见,当请求发送到服务器时,已经是IP地址形式访问。现在面临的问题是:
在相同的IP地址下,由于虚拟主机可以寄存多个不同主机名和域名的Web网站,因此在发送HTTP请求时,必须在Host首部内完整制定主机名或域名的URI。
2.通信数据转发程序:代理、网关、隧道
这些应用程序和服务器可以将请求转发给通信线路上的下一站服务器,并且能够接收从那台服务器发送的响应再转发给客户端。
2.1 代理
代理服务器的基本行为就是接收客户端发送的请求后转发给其他服务器,代理不改变URI,会直接发送给前方持有资源的目标服务器。持有资源实体的服务器被称为源服务器,从源服务器返回的响应经过代理服务器后再传给客户端。在HTTP通信过程中,可以级联多台服务器,请求和响应的转发会经过数台类似锁链一样连接起来的代理服务器,转发时,需要附加Via首部字段以标记经过的主机信息。
使用代理服务器的理由有:利用缓存技术减少网络带宽的流量,组织内部针对特定网站的访问控制,以获取访问日志为主要目的。
- 缓存代理:代理转发响应时,缓存代理会预先将资源的副本保存在代理服务器上,当代理再次接收到对相同资源的请求时,就可以不从源服务器那里获取资源而是将之前缓存的资源作为响应返回。
- 透明代理:转发请求或响应时,不对报文做任何加工的代理类型叫做透明代理,反之,对报文内容进行加工的代理叫做非透明代理。
2.2 网关
网关的工作机制和代理十分相似,而网关能使通信线路上的服务器提供非HTTP协议服务。利用网关可以提高通信的安全性,因为可以在客户端与网关之间的通信线路上加密以确保连接的安全。
2.3 隧道
隧道可以按照要求建立起一条与其他服务器的通信线路,届时使用SSL等加密手段进行通信,隧道的目的是确保客户端与服务器进行安全的通信。隧道本身不会去解析HTTP请求,也就是说,请求会原样中转给之后的服务器,隧道会在通信双方断开连接时结束。
3.保存资源的缓存
缓存是指代理服务器或者客户端本地磁盘内保存的资源副本,利用缓存可以减少对源服务器的访问,也就节省了通信流量和通信时间。缓存服务器时代理服务器的一种,并归类在缓存代理类型中(当代理转发从服务器返回的响应时,代理服务器将会保存一份资源的副本)。缓存服务器的优势在于可以避免多次从服务器转发资源,因此客户端可就近从缓存服务器上获取资源,而源服务器也不必多次处理同样的请求。
3.1 缓存的有效期限
当遇到源服务器上的资源更新时,如果还是用不变的缓存,那就会演变成返回更新前的旧资源了。即使存在缓存,也会因为客户端的要求、缓存的有效期等因素,向源服务器确认资源的有效性。若判断缓存失效,缓存服务器将会再次从源服务器上获取新资源。
3.2 客户端的缓存
缓存不仅可以存在于缓存服务器中,还可以存在客户端浏览器中,以Internet Explorer程序为例,把客户端缓存称为临时网络文件。浏览器缓存如果有效,就不必再向服务器请求相同的资源了,可以从本地磁盘内读取。另外,和缓存服务器相同的一点是,当判定缓存过期后,会向源服务器确认资源的有效性,如果判断浏览器缓存失效,浏览器会再次请求新资源。