http://jxs.me/2010/08/20/websockets-using-ruby-eventmachine/
使用 Ruby Eventmachine 的 Websockets August 20th 2010
HTML5增加了很多新特性,使开发更便利,最终使用更舒心。这里我们讨论其中一个新特性:WebSockets。我们会基于 Ruby 的 Eventmachine gem 来实现。
首先确保你的浏览器支持 WebSockets (如 Chrome, Safari, Firefox trunk)。
设置 EventMachine
使用 EventMachine for WebSockets 非常简单,有个现成的 em-websockets gem。 启动 EventMachine.run block 就可以了, EventMachine::WebSocket.start 会干剩下的活。 It provides a socket object that resembles the javascript WebSocket spec with callbacks for onopen, onmessage, and onclose.
- require 'eventmachine'
- require 'em-websocket'
-
- @sockets = []
- EventMachine.run do
- EventMachine::WebSocket.start(:host => '0.0.0.0', :port => 8080) do |socket|
- socket.onopen do
- @sockets << socket
- end
- socket.onmessage do |mess|
- @sockets.each {|s| s.send mess}
- end
- socket.onclose do
- @sockets.delete socket
- end
- end
- end
本例子中, connected sockets 被添加到数组中,并在 onmessage 被触发时进行广播。
客户端
The client side script listens for keypresses and sends them to the websocket. On receiving a message, which is just a single letter in this case, the corresponding letter will be lit up.
- var socket;
- var alphabet = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
-
- function animateCharacter(letter)
- {
- var upper = letter.toUpperCase();
- $('#character_' + upper)
- .stop(true,true)
- .animate({ opacity: 1}, 100)
- .animate({ opacity: .2}, 100);
- }
-
- function setup()
- {
- var target = $('#alphabet');
- for(var i = 0; i <=alphabet.length; i++)
- {
- var char = alphabet.charAt(i);
- target.append('<span id="character_' + char +'">' + char + '</span');
- }
- connect();
-
- $(document).keypress(function(e){
- var char = String.fromCharCode(e.keyCode);
- socket.send(char);
- });
- };
-
- function connect(){
- socket = new WebSocket('ws://h.jxs.me:8080');
- socket.onmessage = function(mess) {
- animateCharacter(mess.data);
- };
-
- };
-
- window.onload += setup();
With it all put together, WebSockets makes for a simple way to connect users together through the browser without plugins, polling, or other ugly frameworks.
安装 EventMachine
Ruby gem 已经提供了 EventMachine,名字就是 eventmachine。运行 gem install eventmachine 即可安装。
提醒一点, EventMachine 需要系统安装有 C++ 编译器,用于编译本机二进制扩展模块。
使用 EventMachine
从实例中学习,让我们开始吧。
echo service
echo 服务是传统的 UNIX 服务,它的功能就是接受网络连接client 端的输入信息,然后逐字节的原样返回输出到client 。 使用 EventMachine 编写非常简单。
- #!/usr/bin/env ruby
-
- require 'rubygems'
- require 'eventmachine'
-
- module EchoServer
- def receive_data(data)
- send_data(data)
- end
- end
-
- EventMachine::run do
- host = '0.0.0.0'
- port = 8080
- EventMachine::start_server host, port, EchoServer
- puts "Started EchoServer on #{host}:#{port}..."
- end
运行以上代码会在 8080 端口启动一个 echo 监听进程,让我们逐步分析代码。
首先看代码下部的
EventMachine::run
调用。他开启了一个事件循环,其后跟了一个代码块,一般用于启动 clients 或 servers,他将在此次循环的生命周期中一直存在,不会终止,除非我们直接调用
EventMachine::stop_event_loop
。
本实例中我们用
EventMachine::start_server
启动我们的 echo 服务。前面两个参数是服务器和端口号。绑定到
0.0.0.0:8080
上,意味着
EchoServer
服务将在本机的任意 ip 的 8080 端口上监听。
第三个参数是事件处理器(handler)。一般来说处理器会是一个 Ruby module 用于定义回调函数,通过模块也不会污染全局名字空间。这里
EchoServer
仅仅定义了
receive_data
,每当我们通过 connection 接收到数据它都会被触发。
最后,
EchoServer
module 在触发
receive_data
后调用
send_data
,它会通过前面初始化过的 connection 发送数据。
HTTP client
EventMachine
也可被用于创建 clients 。我只需将
EventMachine::start_server
替换成
EventMachine::connect
。下面是一个示例,它连接到一个 HTTP 服务器,将接收到的 headers 打印出来, 程序是
EventMachine
风格的哦。
- #!/usr/bin/env ruby
-
- require 'rubygems'
- require 'eventmachine'
-
- module HttpHeaders
- def post_init
- send_data "GET /\r\n\r\n"
- @data = ""
- end
-
- def receive_data(data)
- @data << data
- end
-
- def unbind
- if @data =~ /[\n][\r]*[\n]/m
- $`.each {|line| puts ">>> #{line}" }
- end
-
- EventMachine::stop_event_loop
- end
- end
-
- EventMachine::run do
- EventMachine::connect 'microsoft.com', 80, HttpHeaders
- end
如果将
'microsoft.com' 修改为
ARGV[0] ,那你可在命令行输入任意网址获取其 headers。
这里我们看到一个新的调用, post_init
。他会在设置连接时调用。在客户端,它说明你已经成功连接上了服务器,在服务端,说明有一个新的客户端连接上来了。
我们还使用了 unbind
调用,它在 connection 的任一端关闭时触发。在这个例子中,就是服务端在发送完所有数据后关闭。如果在服务端程序中,这意味着一个客户端已经断开了。
unbind 和
post_init 功能正好互补。无论何时当网络连接断开或者创建时,former 都会被调用。我难以理解的是为什么不采用类似的命名格式,以便更好的反映这种关系。无论如何,他们就是这样被命名了。
这就是三个主要的回调函数。网络连接创建时的处理,接收数据的处理,以及连接关闭时的处理。其他的基本上同 send_data 类似,不过是一些功能变化的变种。
eventmachine 介绍以及如何避免回调混乱。
事件驱动编程最近变得很新潮,这很大程度是源于 node.js 项目的优雅。其实在 ruby 世界里面通过 eventmachine,我们 已经使用了好多年的事件编程了(eventmachine 为 ruby 添加了事件 IO)。一般来说编写事件驱动的代码比较复杂且混乱,但实际上我们写出来的代码非常漂亮。你只会用到不多的特殊技巧。
最大的挑战实际上是真正理解如何创建一个干净的模型抽象。由于需求不同,代码结构不同,不认真规划,你会很快发现你掉入到回调迷阵当中(这里有个形象的说法,叫意大利面)。此文中会讲解一些通用的模板,其中混合用到了 Twitter streaming API, Google’s language API, and a WebSocket server。绝对没有意大利面,我保证!
做完 eventmachine 入门讲解后,我们会讨论两种通用的抽象。第一个叫对象延迟处理,类似于异步方法调用。第二个是如何抽象代码,以实现多事件触发。最后,我们会添加 WebSocket Server 以演示并行 IO 处理。
eventmachine 起步:
首先是安装 eventmachine : gem install eventmachine
你可以运行以下代码以作测试 ruby test1.rb,终止程序需要 kill 掉哦。
- # test1.rb
-
- require 'rubygems'
- require 'eventmachine'
-
- EventMachine.run {
- EventMachine.add_periodic_timer(1) {
- puts "Hello world"
- }
- }
这个程序每隔一秒输出一个信息,运行不了,首先检查人品问题哈。
它是如何运作的呢? require eventmachine 之后,我们调用了 EventMachine.run,它会接收一个代码块最为参数。现在我们可以无视这些,专注于代码块内部,没有这个 eventmachine 可没法工作啊(如果你有强烈的好奇心,可以学习下 reactor pattern.) EventMachine.run 中我们调用了 add_periodic_timer ,并传入了另外一个代码块。这里告诉 eventmachine 每隔1秒触发一个事件,然后调用代码块。这是我们学到的第一个有用的知识,这个代码块被称之为回调。
你可能会想使用一个循环不是更简单
loop { puts 'hi'; sleep 1 }
,你想的没错。但我保证,往后看,你会知道我们的方式更优。
在网络 IO上使用 eventmachine。
高效的 IO 是 eventmachine 的全部意义所在,一定要理解这一点。当你使用 eventmachine 进行网络 IO 编程时,你要么直接使用 eventmachine,要么是通过 eventmachine 钩子扩展的某种 lib (在 github 上你会找到很多的这种例子,很好识别,因为他们大多以 em- 开头命名)。然后你需要小心挑选使用哪些gems 来进行 database, api 等等的编程。
如果你选择不当就会阻塞 reactor,就是在 IO 操作结束前,eventmachine 将不会触发任何事件。比如说,如果你是用标准库中的 Net::HTTP ,向一个 URL 发出请求,预计10s响应,在此期间上面代码中的定时器都不会触发,直到操作结束。你已经完全丧失了并发性。
我们讨论下 HTTP client。 eventmachine 已经自带有两个不同的 HTTP client,但都有些问题,我们推荐不要用它们,这里有个更为强大的模块:em-http-request 。
安装:gem install em-http-request让我们通过它发出一个 http 请求,看看它如何工作的。(注:EM 是 EventMachine 的缩写,大家都喜欢少打几个字吧!)
- require 'rubygems'
- require 'eventmachine'
-
- EM.run {
- require 'em-http'
-
- EM::HttpRequest.new('http://json-time.appspot.com/time.json').get.callback { |http|
- puts http.response
- }
- }
Again we’re attaching a callback which is called once the request has completed. We’re attaching it in a slightly different way to the timer above, which we’ll discuss next.
Abstracting code that has a success or failure case
在设计 API 接口时,需要有办法来区分响应成功或者失败。在 Ruby中,有两种常用的方法。一种是返回 nil ,一种是抛出异常(比如 ActiveRecord::NotFound)。Eventmachine 提供了一种更为优雅的方案:the deferrable。
deferrable 是一个对象,通过它你可以添加上成功或者失败后的回调方法,名字分别为 callback 和 errback。愿意的话,你可以查看源码 code, 不算复杂.
前面代码中调用 HttpRequest#get 时,返回的就是一个 deferrable (实际上返回的是一个 EM::HttpClient 实例对象,它实际上也被 mix in 到了EM::Deferrable 模块中)。当然也有更为通用的办法,就是直接使用 EM::DefaultDeferrable。
As an excuse to use a deferrable ourselves I’ve decided that it would be a jolly marvelous idea to look up the language of tweets as they arrive from the twitter streaming API.
Handily, the Google AJAX Language API allows you to get the language of any piece of text. It’s designed to be used from the browser, but we won’t let a small matter like that stop us for now (although you should if it’s a real application).
When I’m trying out a new API I generally start with HTTParty (gem install httparty) since it’s just so quick and easy to use. Warning: you can’t use HTTParty with eventmachine since it uses Net::HTTP under the covers – this is just for testing!
- require 'rubygems'
- require 'httparty'
- require 'json'
-
- response = HTTParty.get("http://www.google.com/uds/GlangDetect", :query => {
- :v => '1.0',
- :q => "Sgwn i os yw google yn deall Cymraeg?"
- })
-
- p JSON.parse(response.body)["responseData"]
-
- # => {"isReliable"=>true, "confidence"=>0.5834181, "language"=>"cy"}
Cool, Google understands Welsh!
在将这段代码修改为使用 use em-http-request 前 (HTTParty 是使用的Net::HTTP ),我们先将它封装成一个类,拿它同我们随后要写的 eventmachine 版本做下比较。无法判定语言则返回 nil 值。
- require 'rubygems'
- require 'httparty'
- require 'json'
-
- class LanguageDetector
- URL = "http://www.google.com/uds/GlangDetect"
-
- def initialize(text)
- @text = text
- end
-
- # Returns the language if it can be detected, otherwise nil
- def language
- response = HTTParty.get(URL, :query => {:v => '1.0', :q => @text})
-
- return nil unless response.code == 200
-
- info = JSON.parse(response.body)["responseData"]
-
- return info['isReliable'] ? info['language'] : nil
- end
- end
-
- puts LanguageDetector.new("Sgwn i os yw google yn deall Cymraeg?").language
现在将代码修改为使用 em-http-request:
- require 'rubygems'
- require 'em-http'
- require 'json'
-
- class LanguageDetector
- URL = "http://www.google.com/uds/GlangDetect"
-
- include EM::Deferrable
-
- def initialize(text)
- request = EM::HttpRequest.new(URL).get({
- :query => {:v => "1.0", :q => text}
- })
-
- # This is called if the request completes successfully (whatever the code)
- request.callback {
- if request.response_header.status == 200
- info = JSON.parse(request.response)["responseData"]
- if info['isReliable']
- self.succeed(info['language'])
- else
- self.fail("Language could not be reliably determined")
- end
- else
- self.fail("Call to fetch language failed")
- end
- }
-
- # This is called if the request totally failed
- request.errback {
- self.fail("Error making API call")
- }
- end
- end
-
- EM.run {
- detector = LanguageDetector.new("Sgwn i os yw google yn deall Cymraeg?")
- detector.callback { |lang| puts "The language was #{lang}" }
- detector.errback { |error| puts "Error: #{error}" }
- }
返回结果如下:
这段代码看起来完全不同。最大的区别是,由于引入了EM::Deferrable,无论我们的调用成功或者失败,相应的 callback 或 errback 代码都会被执行。
作为练习,你可以试着修改下代码,让它允许三次错误,期间重复调用相关方法。这同现实情况极其类似,通过这个封装我们很好的隐藏了复杂性,完成后我们也不用再关心内部实现细节了。
抽象代码,允许多次返回多个事件。
现在我们将进入 eventmachine 最擅长的领域,接触它最激动人心的特性。
我们将构建一个 client ,连接到 Twitter’s streaming api ,每当有消息到达时,将触发一系列事件。
使用 Twitter’s streaming API ,你只需要开启一个活跃的长 HTTP 连接到stream.twitter.com,然后等待信息涌入。我们会再次使用到 em-http-request。连接到 API,监听所有的 tweets ,静待新的 twitter 到达,代码很简单:
- http = EventMachine::HttpRequest.new('http://stream.twitter.com/1/statuses/filter.json').post({
- :head => { 'Authorization' => [username, password] },
- :query => { "track" => "newtwitter" }
- })
这里返回的是一个 deferrable (用于请求完成后触发相应回调函数), 实际上我们用到了另外一个技巧。 We can also register to be notified every time new data is received:
- http.stream do |chunk|
- # This chunk may contain one or more tweets separated by \r\n
- end
让我们把代码组合起来,监听 tweets:
- require 'rubygems'
- require 'em-http'
- require 'json'
-
- EM.run {
- username = 'yourtwitterusername'
- password = 'password'
- term = 'newtwitter'
- buffer = ""
-
- http = EventMachine::HttpRequest.new('http://stream.twitter.com/1/statuses/filter.json').post({
- :head => { 'Authorization' => [ username, password ] },
- :query => { "track" => term }
- })
-
- http.callback {
- unless http.response_header.status == 200
- puts "Call failed with response code #{http.response_header.status}"
- end
- }
-
- http.stream do |chunk|
- buffer += chunk
- while line = buffer.slice!(/.+\r\n/)
- tweet = JSON.parse(line)
- puts tweet['text']
- end
- end
- }
返回信息类似如下:
- Hey @Twitter. When shall I be getting the #NewTwitter?
- #NewTwitter #Perfect
- WHAHOO WTF? #NewTwitter is
- Buenos das a =) Estoy sola en la office, leyendo Le Monde y probando el #NewTwitter desde FireFox, que funciona de
- Curiosity and boredom got the better of me...I
It works! Now say we wanted to lookup the language of each tweet using the class we built earlier. We could do this by adding further to our stream method, however this is the road to callback hell (and just imagine what it would be like if we hadn’t abstracted the language detection!).
- http.stream do |chunk|
- buffer += chunk
- while line = buffer.slice!(/.+\r\n/)
- tweet = JSON.parse(line)
- text = tweet['text']
- detector = LanguageDetector.new(text)
- detector.callback { |lang|
- puts "Language: #{lang}, tweet: #{text}"
- }
- detector.errback { |error|
- puts "Language could not be determined for tweet: #{text}"
- }
- end
- end
我们来重写优化部分代码。
前面我们使用 deferrable 来抽离代码,用于处理异步事件返回的成功或失败。另外一个在 eventmachine 中广泛采用的通用技术是提供一个 onevent 回调。比如类似如下的接口代码:
- stream = TweetStream.new(username, password, term)
- stream.ontweet { |tweet| puts tweet }
As if by magic here is the code!
- require 'rubygems'
- require 'em-http'
- require 'json'
-
- class TwitterStream
- URL = 'http://stream.twitter.com/1/statuses/filter.json'
-
- def initialize(username, password, term)
- @username, @password = username, password
- @term = term
- @callbacks = []
- @buffer = ""
- listen
- end
-
- def ontweet(&block)
- @callbacks << block
- end
-
- private
-
- def listen
- http = EventMachine::HttpRequest.new(URL).post({
- :head => { 'Authorization' => [ @username, @password ] },
- :query => { "track" => @term }
- })
-
- http.stream do |chunk|
- @buffer += chunk
- process_buffer
- end
- end
-
- def process_buffer
- while line = @buffer.slice!(/.+\r\n/)
- tweet = JSON.parse(line)
-
- @callbacks.each { |c| c.call(tweet['text']) }
- end
- end
- end
现在我们可以对代码进一步优化:
- EM.run {
- stream = TwitterStream.new('yourtwitterusername', 'pass', 'newtwitter')
- stream.ontweet { |tweet|
- LanguageDetector.new(tweet).callback { |lang|
- puts "New tweet in #{lang}: #{tweet}"
- }
- }
- }
同一处理流程中混合不同的 IO
使用 eventmachine 不会阻塞任何 IO 操作,我们由此得到另外一个优势,同一处理流程中可以混合使用不同类型的 IO 。作为示例,我们使用 WebSocket 实时推送 tweets 到浏览器端。幸运的是已经有一个现成的使用 eventmachine 的 WebSocket server,em-websocket (同 Pusher 中使用的非常类似)。
先安装:gem install em-websocket.
启动服务,代码如下:
- stream.ontweet { |tweet|
- LanguageDetector.new(tweet).callback { |lang|
- puts "New tweet in #{lang}: #{tweet}"
-
- websocket_connections.each do |socket|
- socket.send(JSON.generate({
- :lang => lang,
- :tweet => tweet
- }))
- end
- }
- }
完成手工,代码很干净!