在XMPP扩展协议XEP-0124中定义了一个传输协议来模拟两个实体 (例如一个客户端和一个服务器) 之间的长连双向TCP连接的语义,它有效地运用多个同步的HTTP"请求/应答"对,而不需要使用频繁的轮询或者分块响应。该协议简称BOSH(Bidirectional-streams Over Synchronous HTTP),协议的设计目标之一是提供准TCP的连接性能同时兼容受约束的运行环境。
web im是一种具有较高实时性需求的应用,应用要求服务器能实时的将更新信息推送到浏览器客户端。而面向浏览器的消息推送技术到目前已经有了很大发展,各种技术各有优缺点和局限性,这里我们先来比较下各类“面向浏览器的服务器推”技术:
1. Flash XML Socket
该技术要求浏览器安装Flash插件,在Html页面中潜入一个使用了XML Socket类的Flash程序,通过javascript与其交互实现和服务器的长连接通信。
这项技术曾在淘宝旺旺历史上被使用过,后来因为各类兼容性问题而放弃使用。
2. 基于HTTP长连接的Comet
该技术要求客户端浏览器支持HTTP/1.1,HTTP/1.1协议定义的一些技术规范被应用与实践中,例如持久连接、chunked transfer-encoding、pipeline等。
对于一些受限的客户端(移动终端等)可能不能很好的支持像chunked(块传输)、pipeline等特性。
3. Websocket
这是HTML5的一种新协议,可能是将来实现服务器端推送的最佳方式,但不是现在。
4. long-polling(长轮询)
BOSH协议正是采用该方式实现,也是目前最常用的方式(兼容性和性能平衡度最好)。
因为HTTP是一个同步请求/应答协议,传统的通过HTTP模拟双向流的解决方案是让客户端HTTP间歇性地轮询服务器来查询是否有任何等待发送给客户端的数据。当没有数据需要传输的时候,这种幼稚的做法在轮询的时候浪费了很多网络带宽,它也降低了应用程序的响应,因为数据要花时间排队直到服务器从客户端接收下一次轮询 (HTTP 请求) 。 这导致了响应速度和带宽之间难免顾此失彼, 因为增加轮询频率将在减少延迟的同时增加带宽消耗 (如果轮询频率降低的话,反之亦然)。长轮询比之传统轮询的优势就在于如何实现“长”这个字上。
BOSH使用的技术可以描述为:
- 客户端请求服务器后,服务器在有数据发送给客户端之前不去应答请求。服务器hold住了来自客户端的连接并等待发送给客户端的数据准备好。
- 在服务器hold住客户端连接时,若客户端需要发送数据,假如客户端支持HTTP pipline技术则只需在该连接上再发送一个请求,若不支持,则新起一个连接发送请求。
- BOSH要求同一个客户端不能同时建立超过2个并发连接
- 一旦客户端发送的第二个请求到达时,服务器立刻应答第一个请求并释放hold住的第一个请求连接,保证客户端始终能立刻发送更多数据。
- 一段时间内连接双向都无数据传输时,服务器以空数据包应答客户端,客户端收到应答后立刻发起一个新的请求,这模拟了TCP长连接的心跳机制。
POST /webclient HTTP/1.1 Host: httpcm.example.com Accept-Encoding: gzip, deflate Content-Type: text/xml; charset=utf-8 Content-Length: 104 <body content='text/xml; charset=utf-8' // 指定客户端在应答中支持的内容编码 from='user@example.com' // 客户端JID hold='1' // 指定服务器在会话过程中允许同时保持的最大数量 rid='1573741820' // 请求id to='example.com' // 服务domain,对应JID中的domain route='xmpp:example.com:9999' // 该domain下具体的主机(一个域下可能有多个主机) ver='1.6' // BOSH协议版本 wait='60' // 服务器允许hold住连接的等待时间(单位秒) ack='1' // 表示客户端支持确认机制 xml:lang='en' xmlns='http://jabber.org/protocol/httpbind'/>若将wait或hold中的一个置为0,那么长轮询将退化为传统轮询
HTTP/1.1 200 OK
Content-Type: text/xml; charset=utf-8
Content-Length: 128
<body wait='60' // 必须小于请求中指定的值
inactivity='30' // 若超出该期限没有客户端连接被保持则服务端中止会话(类似TCP超时机制)
polling='5' // 指定允许客户端最小轮询间隔(不低于5秒的轮询间隔)
requests='2'
hold='1'
ack='1573741820' // 对应rid
accept='deflate,gzip' // 服务器支持的内容编码
maxpause='120' // 表示服务器支持临时会话暂停的最大长度
sid='SomeSID' // session id
charsets='ISO_8859-1 ISO-2022-JP'
ver='1.6'
from='example.com'
xmlns='http://jabber.org/protocol/httpbind'/>
3. BOSH传输信息
POST /webclient HTTP/1.1 Host: httpcm.example.com Accept-Encoding: gzip, deflate Content-Type: text/xml; charset=utf-8 Content-Length: 188 <body rid='1249243562' sid='SomeSID' xmlns='http://jabber.org/protocol/httpbind'> <message to='contact@example.com' xmlns='jabber:client'> <body>Good morning!</body> </message> <message to='friend@example.com' xmlns='jabber:client'> <body>Hey, what's up?</body> </message> </body>
在一个等待周期里没有数据准备好,则应答一个空body
HTTP/1.1 200 OK Content-Type: text/xml; charset=utf-8 Content-Length: 64 <body xmlns='http://jabber.org/protocol/httpbind'/>