WEB 的实时事件

    面这些可以实现基于web的实时事件通知的方法.在他们的实验性研究中在一个利用comet推送方式实现(dojo的cometd库,dwr的反向ajax)的ajax应用和一个纯拉取方式的应用之间,对数据一致性、服务器性能、网络性能以及数据遗失进行了比较。

  使用ajax可以开发出基于浏览器的具有高用户交互性和几乎不易觉察到延迟的web应用。实时的动态数据比如新闻标题、证券报价和拍卖行情都需要尽快地发送给用户。然而,ajax仍然受限于web请求/响应架构的弱点,使得服务器不能推送实时动态的web数据。

  1.http拉取方式:在这种传统的方法中,客户端以用户可定义的时间间隔去检查服务器上的最新数据。这种拉取方式的频率要足够高才能保证很高的数据精确度,但高频率可能会导致多余的检查,从而导致较高的网络流量。而另一方面,低频率则会导致错过更新的数据。理想地,拉取的时间间隔应该等于服务器状态改变的速度。

  2.http流:这种方法由存在于不间断的http连接响应中或某个xmlhttprequest连接中的服务器数据流所组成。

  3.反转ajax:服务流应用到ajax,就是所谓的反转ajax 或者comet 。它使得服务器在某事件发生时可以发送消息给客户端,而不需要客户端显式的请求。目标在于达到状态变化的实时更新。comet使用了http/1.1中的持续连接的特性。通过http/1.1,除非另作说明,服务器和浏览器之间的tcp连接会一直保持连接状态,直到其中一方发送了一条明显的“关闭连接”的消息,或者有超时以及网络错误发生。

  4.长时间轮询:也就是所谓的异步轮询,这种方式是纯服务器端推送方式和客户端拉取方式的混合。它是基于bayeux协议的。这个协议遵循基于主题的发布——订阅机制。在订阅了某个频道后,客户端和服务器间的连接会保持打开状态,并保持一段事先定义好的时间。如果服务器端没有事件发生,而发生了超时,服务器端就会请求客户端进行异步重新连接。如果有事件发生,服务器端会发送数据到客户端,然后客户端重新连接。

  =====================================

  基于 web 的实时事件通知方式大致有五种方案:http拉取方式(pull),http流,long polling,flash xmlsocket方式,java applet。

  首先说下comet这个词,comet 这个词是最早由alex russell(dojo toolkit 的项目 lead)提出的,称基于 http 长连接、无须在浏览器端安装插件的“服务器推(push)”技术为“comet”。

  1.http拉取方式(pull)

  在这种传统的方法中,客户端以用户可定义的时间间隔去检查服务器上的最新数据。这种拉取方式的频率要足够高才能保证很高的数据精确度,但高频率可能会导致多余的检查,从而导致较高的网络流量。而另一方面,低频率则会导致错过更新的数据。理想地,拉取的时间间隔应该等于服务器状态改变的速度。常见的实现如利用 "<meta http-equiv="refresh" c />" tag,当然利用xmlhttprequest定时取也是一种方法。

  2.http流(push机制)

  http流有两种形式:

  * page stream: 页面上不间断的http连接响应(http 1.1 keep alive).

  通过在 html 页面里嵌入一个隐蔵帧(iframe),然后将这个隐蔵帧的 src 属性设为对一个长连接的请求,服务器端就能源源不断地往客户端输入数据。

  * service stream: xmlhttprequest连接中的服务器数据流。

  客户端是在 xmlhttprequest 的 readystate 为 4(即数据传输结束)时调用回调函数,进行信息处理。当 readystate 为 4 时,数据传输结束,连接已经关闭。mozilla firefox 提供了对 streaming ajax 的支持,即 readystate 为 3 时(数据仍在传输中),客户端可以读取数据,从而无须关闭连接,就能读取处理服务器端返回的信息。ie 在 readystate 为 3 时,不能读取服务器返回的数据,目前 ie 不支持基于 streaming ajax。

  注:使用 page stream(iframe) 请求一个长连接有一个很明显的不足之处:ie、morzilla firefox 下端的进度栏都会显示加载没有完成,而且 ie 上方的图标会不停的转动,表示加载正在进行。google 的天才们使用一个称为“htmlfile”的 activex 解决了在 ie 中的加载显示问题,并将这种方法用到了 gmail+gtalk 产品中。alex russell 在“what else is burried down in the depth's of google's amazing javascript?”文章中介绍了这种方法。zeitoun 网站提供的 comet-iframe.tar.gz,封装了一个基于 iframe 和 htmlfile 的 javascript comet 对象,支持 ie、mozilla firefox 浏览器,可以作为参考。(http://alex.dojotoolkit.org/?p=538)

  3.长时间轮询(long polling)

  也就是所谓的异步轮询(asynchronous polling),这种方式是纯服务器端推送方式和客户端拉取方式的混合。它是基于bayeux协议(http://svn.xantus.org/shortbus/trunk/bayeux/bayeu x.html)的。这个协议遵循基于主题的发布——订阅机制。在订阅了某个频道后,客户端和服务器间的连接会保持打开状态,并保持一段事先定义好的时间(默认为45秒)。如果服务器端没有事件发生,而发生了超时,服务器端就会请求客户端进行异步重新连接。如果有事件发生,服务器端会发送数据到客户端,然后客户端重新连接。

  1. 服务器端会阻塞请求直到有数据传递或超时才返回。

  2. 客户端 javascript 响应处理函数会在处理完服务器返回的信息后,再次发出请求,重新建立连接。

  3. 当客户端处理接收的数据、重新建立连接时,服务器端可能有新的数据到达;这些信息会被服务器端保存直到客户端重新建立连接,客户端会一次把当前服务器端所有的信息取回。

  4.flash xmlsocket(push机制)

  如果 web 应用的用户接受应用只有在安装了flash 播放器才能正常运行,那么使用 flash 的 xmlsocket 是一个可行的方案。

  这种方案实现的基础是:

  1. flash 提供了 xmlsocket 类(flash 7.0.14以上版本)。

  2. javascript 和 flash 的紧密结合:在 javascript 可以直接调用 flash 程序提供的接口。

  具体实现方法:在 html 页面中内嵌入一个使用了 xmlsocket 类的 flash 程序。javascript 通过调用此 flash 程序提供的套接口接口与服务器端的套接口进行通信。javascript 在收到服务器端以 xml 格式传送的信息后可以很容易地控制 html 页面的内容显示。

  关于如何去构建充当了 javascript 与 flash xmlsocket 桥梁的 flash 程序,以及如何在 javascript 里调用 flash 提供的接口,我们可以参考 aflax(asynchronous flash and xml)项目提供的 socket demo 以及 socketjs(请参见 [http://www.aflax.org/ asynchronous flash and xml,提供了强大的 flash、javascript 库和很多范例。])。

  javascript 与 flash 的紧密结合,极大增强了客户端的处理能力。从 flash 播放器 v7.0.19 开始,已经取消了 xmlsocket 的端口必须大于 1023 的限制。linux 平台也支持 flash xmlsocket 方案。但此方案的缺点在于:

  1. 客户端必须安装 flash 播放器;

  2. 因为 xmlsocket 没有 http 隧道功能,xmlsocket 类不能自动穿过防火墙;

  3. 因为是使用socket接口,需要设置一个通信端口,防火墙、代理服务器也可能对非 http 通道端口进行限制;

  4. 必须使用xml格式作为消息格式,数据冗余增大。

  此方案在一些网络聊天室,网络互动游戏中得到广泛使用。

  5. java applet(push机制)

  类似于flash xmlsocket方式。目前已经很少使用,原因极可能是因在手机等移动终端缺少支持。

  总结和建议:

  如果我们想要高数据一致性和高网络性能,我们就应该选择推送方式。但是,推送会带来一些扩展性问题;服务器应用程序cpu使用率是拉取方式的7倍。根据tud(http://swerl.tudelft.nl/twiki/pu ... d-serg-2007-016.pdf)的测试结果,服务器性能会在350-500个用户时趋于饱和。对于更大数量的用户,服务器端需要维护大量并发的长连接。在这种应用背景下,服务器端需要考虑负载均衡和集群技术;或是在服务器端为长连接作一些改进。

  使用拉取方式,要想达到完整的数据一致性以及很高的网络性能是很困难的。如果拉取的时间间隔大于数据更新的时间间隔,就会发生一些数据的遗失。而如果小于数据更新的时间间隔,网络性能就会受到影响。拉取方式只有在拉取时间间隔等同于数据更新时间间隔时,才会恰到好处。但是,为了达到那样的目标,我们就需要提前知道准确的数据更新时间间隔。然而,数据更新的时间间隔很少是静态不变并可以预知的。这使得拉取方式只有在数据是根据某种特定模式发布的情况才有用。

  控制信息与数据信息使用不同的 http 连接

  使用长连接时,存在一个很常见的场景:客户端网页需要关闭,而服务器端还处在读取数据的堵塞状态,客户端需要及时通知服务器端关闭数据连接。服务器在收到关闭请求后首先要从读取数据的阻塞状态唤醒,然后释放为这个客户端分配的资源,再关闭连接。所以在设计上,我们需要使客户端的控制请求和数据请求使用不同的 http 连接,才能使控制请求不会被阻塞。

  在实现上,如果是基于 iframe 流方式的长连接,客户端页面需要使用两个 iframe,一个是控制帧,用于往服务器端发送控制请求,控制请求能很快收到响应,不会被堵塞;一个是显示帧,用于往服务器端发送长连接请求。如果是基于 ajax 的长轮询方式,客户端可以异步地发出一个 xmlhttprequest 请求,通知服务器端关闭数据连接。

  在客户和服务器之间保持“心跳”信息

  在浏览器与服务器之间维持一个长连接会为通信带来一些不确定性:因为数据传输是随机的,客户端不知道何时服务器才有数据传送。服务器端需要确保当客户端不再工作时,释放为这个客户端分配的资源,防止内存泄漏。因此需要一种机制使双方知道大家都在正常运行。在实现上:

  1. 服务器端在阻塞读时会设置一个时限,超时后阻塞读调用会返回,同时发给客户端没有新数据到达的心跳信息。此时如果客户端已经关闭,服务器往通道写数据会出现异常,服务器端就会及时释放为这个客户端分配的资源。

  2. 如果客户端使用的是基于 ajax 的长轮询方式;服务器端返回数据、关闭连接后,经过某个时限没有收到客户端的再次请求,会认为客户端不能正常工作,会释放为这个客户端分配、维护的资源。

  3. 当服务器处理信息出现异常情况,需要发送错误信息通知客户端,同时释放资源、关闭连接。 

你可能感兴趣的:(java,工作)