MultiStone

分布式Ruby解决之道 - DRb

分布式Ruby解决之道

其实用Druby很久了，今天需要完成一个进程数据同步的机制，我需要的不是运行速度快，不是用 linux / mac 下的扩展，而是独立，快速开发效率，方便最简单的Ruby环境可运行，可以吗？ DRb(即分布式Ruby，下面都这样说它)是内置于Ruby标准库中的对象代理的实现。什么是对象代理，现在不明白不要紧，一会就知道了。

解决什么样的问题？

有的时候，我们需要提供远程的服务，比如提供远程API调用（如果你听过RPC，或WDSL），这样，我们可以很大程度上解耦各大模块，对外提供服务。

还有的时候，我们需要在两个进程中通信，以获得互相的同步或资源。

更有，我想实现实现某种透明的对象，让对象可以在不同的进程或主机上传递。

这些，都可以通过 DRb 来实现。DRb 的相关文档非常少，但在想快速实现一个轻量级分布应用，依赖最少化时，使用它是非常方便的。我对分布式的研究不多，欢迎各位看了本文后能提出更多解决方案。

使用方法

依官方的例子为主，各位看官建议看的时候复制下试试。因为是分布式解决方案，肯定是服务端与客户端双方的代码。

简单的例子

* 服务端

        # ==== 服务端代码，保存为 timer_server.rb
        #
        require 'drb/drb'

        # 监听的地址，你可以改为 0.0.0.0 来支持远程连接
        URI="druby://localhost:8787"

        class TimeServer

          def get_current_time
            return Time.now
          end

        end

        # 被代理的对象，客户端获取的到的对象就是它
        FRONT_OBJECT=TimeServer.new

        DRb.start_service(URI, FRONT_OBJECT)
        # 
        DRb.thread.join

* 客户端

        # ==== timer_client.rb

        require 'drb/drb'

        SERVER_URI="druby://localhost:8787"

        # 这句是必要的，因为我们很快会用到回调与引用，一会说。
        # 所以纯粹的客户端是不存在的。
        DRb.start_service

        timeserver = DRbObject.new_with_uri(SERVER_URI)
        puts timeserver.get_current_time

我必须要说的是，很符合我们的 C/S 模型，但是你有没有想过如果 `get_current_time` 返回一个远程对象，会发     生什么呢？ 接下来，就是我要讲的。

远程对象代理

* 服务端


        require 'drb/drb'

        URI="druby://localhost:8787"

        class Logger

          # Logger 是被远程代理，客户端不会存在，所以用这句
          include DRb::DRbUndumped

          def initialize(n, fname)
            @name = n
            @filename = fname
          end

          def log(message)
            File.open(@filename, "a") do |f|
              f.puts("#{Time.now}: #{@name}: #{message}")
            end
          end

        end

        class LoggerFactory

          def initialize(bdir)
            @basedir = bdir
            @loggers = {}
          end

          def get_logger(name)
            if [email protected]_key? name
              # 保证文件名是合法的
              fname = name.gsub(/[.\/]/, "_").untaint
              @loggers[name] = Logger.new(name, @basedir + "/" + fname)
            end
            return @loggers[name]
          end

        end
        # 在执行之前你要手动创建一下dlog
        FRONT_OBJECT=LoggerFactory.new("dlog")

        DRb.start_service(URI, FRONT_OBJECT)
        DRb.thread.join

客户端
```
    require 'drb/drb'

    SERVER_URI="druby://localhost:8787"

    DRb.start_service

    log_service=DRbObject.new_with_uri(SERVER_URI)

    ["loga", "logb", "logc"].each do |logname|

      logger=log_service.get_logger(logname)

      logger.log("Hello, world!")
      logger.log("Goodbye, world!")
      logger.log("=== EOT ===")

    end
```
吐嘈，执行完，你会发现日志被写在了服务端的 dlog/ 目录里，注意 DRb::DRbUndumped 在Logger 对象的加载，这样的对象是无须传递给客户端的，这样，客户端代码里拿到的 loggger 对象是远程代理对象，所有该对象调用的方法实际上是在远程服务端执行的。我们称这种方法是按引用传递。

那当然有一种传递叫，按值传递，什么情况是呢？显然，上面第一种方法即是，我们调用get_current_time 是本地对象，再调用该对象的方法时，方法在本地执行。

如此，便是 DRb 的基本使用方法了，应该说不难理解。你可以这样理解，都是对象，只不是有些对象是远程的，有些是本地的，远程的对象方法的执行是在远端，本地的方法是在本地。远程的对象是包含了 DRb::DRbUpdumped 的对象。不包含的都会转换为本地对象。

那么，何为分布式的 Ruby，这明显是忽悠我们群众嘛？别急，我正要说，还记得一开始代码里注释的start_service 了吧。所谓 服务端 可以随时获取 客户端 的远程对象，对吧？所以用 DRb 实现一个通信是非常简单的。为了有深入理解，我想需要将它的实现原理分析一下。

如何实现的呢

DRb 的本质是，一个通信底层，一个序列化方式，一个代理器，OK？你不用看都能知道是吧？因为我也会这样实现的。

代理器

method_missing 将一个对象的方法传递给另一个对象的神器，谓之代理，多像有关部门，不做事情，只是将事情移交给另一个有关部门。看看核心代码：

# drb/drb.rb: 1078 （ruby-1.9.3）
def method_missing(msg_id, *a, &b)
  if DRb.here?(@uri)
    obj = DRb.to_obj(@ref)
    DRb.current_server.check_insecure_method(obj, msg_id)
    return obj.__send__(msg_id, *a, &b)
  end

  succ, result = self.class.with_friend(@uri) do
  DRbConn.open(@uri) do |conn|
    conn.send_message(self, msg_id, a, b)
  end
  #。。。处理异常
end

obj显然是被代理的对象，上面除了缓存机制外，send_message 是 method_missing做的最重要的事，它引出来了下面的事情。

通信底层

DRb 的底层是一层透明的传输协议，通过它的接口，可以将数据（或命令）无压力收取，且看它的关键接口：

# drb/drb.rb:728 打开一个连接
def open(uri, config, first=true)
  @protocol.each do |prot|
    begin
      return prot.open(uri, config)
    rescue DRbBadScheme
    rescue DRbConnError
      raise($!)
    rescue
      raise(DRbConnError, "#{uri} - #{$!.inspect}")
    end
  end
  if first && (config[:auto_load] != false)
    auto_load(uri, config)
    return open(uri, config, false)
  end
  raise DRbBadURI, 'can\'t parse uri:' + uri
end

# drb/drb.rb:901 发送一个请求，通俗的说，调用一个方法
def send_request(ref, msg_id, arg, b)
  @msg.send_request(stream, ref, msg_id, arg, b)
end

# 在服务端，接受一个方法
def recv_request
  @msg.recv_request(stream)
end

# 服务端，发送一个结果
def send_reply(succ, result)
  @msg.send_reply(stream, succ, result)
end

# 客户端，接受一个结果
def recv_reply
 @msg.recv_reply(stream)
end

继续吐嘈，默认 DRb 使用 DRbTCPSocket 来通信，你可以随时调整为 UnixSocket 或者 Http ，甚至 SSL。这个视你的需求而定，比如你要从公司用基于 Ruby 的方法，遥控你的家用电脑，建议你使用 SSL。

抽象你的接口，是实现易于维护系统的关键，是吧。如何序列化是整个 DRb 的关键，而在 Ruby 中，这一切显得如此简单。

序列化方法（与对象引用转换）

Marshal 神器用来序列化对象，默认直接使用即可。例如：

class A
  def initialize(a)
    @a = a
  end
end
a = A.new(1)
b = Marshal.dump(a)
c = Marshal.load(b)
puts c.a  # ok, 输出 1

它被引用在 DRb 中，做为 DRbMessage 的关键，传递对象使用。

于是，组合以上思路，DRb 就产生了，不过，我们还缺点什么没讲，作为安全的程序员，一定要看看。

代理对象如果被发送了 instance_eval("rm -rf /") Ok，我们系统没了。。。

所以，$SAFE = 1 是可以保障基本安全的，然而，这还不够，更细的控制，应该由 Ruby 1.9.1 以后（应该是说我没深入研究过）开始的，我就不细说了，你如果有需求可以仔细看看。

另一个问题是，分布式要求远程对象长期生效，那么你可以去研究下 DRb::TimerIdConv 进行生存期保存。

最后一个问题，远程对象支持 block 调用吗？答案是，YES。如何实现的呢？

   # drb/invokemethod.rb 
   def perform_with_block
     @obj.__send__(@msg_id, *@argv) do |*x|
       jump_error = nil
       begin
         block_value = block_yield(x) #本质是 block.call(*x)，只是特殊处理了 Array
       rescue LocalJumpError
         jump_error = $!
       end
       if jump_error
        case jump_error.reason
        when :break
          break(jump_error.exit_value)
        else
          raise jump_error
        end
     end
     block_value
   end

看的出来（再吐嘈），block是通过本地的调用后，将结果再传递给远程对象。详细可以继续看 drb/drb 里的perform 实现。

值得注意的是，如果一个对象没有 include DRb::DRbUndumped 被返回到客户端，则会抛出DRbUnknownError 异常。这个很容易理解。另一个注意点是，一个类无法使用 Marshal.dump 时（例如打开了一个文件句柄），则需要想办法自己实现它，或者。。。或者你应该实现为远程代理类，对吧。

好了，基本上都讲完了。代码里还有许多精华，例如 self.allcate 可以跳过 initialize 来创建一个类。

看完后，你再想想开篇的需求是否可以轻松解决掉？实际上只需要几步：

创建一个类，按一般方法编写它的方法。如果方法有返回自定义对象，根据是否远程代理加载DRbUpdumped。
加载 DRb ，启动服务。
客户端连接，获取代理对象，调用方法。

与其他语言的解决方案的对比与区别

JAVA的 RMI

RMI 是JAVA的远程调用实现方法，这里有一篇不错的介绍：http://damies.iteye.com/blog/51778 。

DRb 是分布式的，RMI是单向的 C/S。 DRb 不需要声明接口，直接使用。熟练后，可以极快速度完成一个通信和同步的应用。

CORBA

看这个：http://zh.wikipedia.org/wiki/CORBA ，基本原理相同，不过 DRb 足够轻，足够快。

WDSL

利用xml的标准RPC调用。适合于静态语言。

由于对其他的了解不深入，欢迎熟悉的看客们提出你的看法。

其他需求

在公司之前的工作时，需要将 JRuby 的对象代理到 Ruby 中，这样可以复用 gems 。
需要远程API的方法调用另一个进程的所有方法。

因为要代理所有本地不存在的对象，只使用 DRb 还不够。但基本思路很简单，利用一个模块的const_missing 动态加载远程的对象，而远程对象在创建时均自动加载 DRbUpdumped 被远程代理。根据以上，我们可以写一个看似本地代码却可以轻易转到远程执行。

例如：

    # 本地代码
    require 'watir'
    ie = Watir::IE.new
    ie.goto("www.baidu.com") # 本地打开一个浏览器

    # 加载为远程进程执行
    ATU.require 'watir'
    ie = ATU::Watir::IE.new
    ie.goto("www.baidu.com") # 远程的进程打开一个浏览器

有了它，几乎同一份代码可以同用两个用途。可以非常方便的以代码级的控制远程主机和对象，并且重用性很高。

如何实现，可以自己想想，同时可以查看这里：ruby_proxy的实现

你可能感兴趣的:(Ruby&Perl)

Mac 安装和管理多个 Python 版本 helloxielan python php 操作系统
背景在MacOS10.15Catalina即将公测之际，国外技术论坛发表了一篇名为《macOS10.15Catalina弃用UNIX脚本语言》的帖子，其中说到：较旧的Python语言版本2.7在MacOS10.15Catalina中已被弃用，不会包含在MacOS10.16中。其他UNIX脚本语言（Ruby&Perl）也是如此。然后在MacOS10.14以及之前的版本，都是内置的Python2版本。
Mac 安装和管理多个Python版本 TinyDolphin Python Python pyenv
背景在MacOS10.15Catalina即将公测之际，国外技术论坛发表了一篇名为《macOS10.15Catalina弃用UNIX脚本语言》的帖子，其中说到：较旧的Python语言版本2.7在MacOS10.15Catalina中已被弃用，不会包含在MacOS10.16中。其他UNIX脚本语言（Ruby&Perl）也是如此。然后在MacOS10.14以及之前的版本，都是内置的Python2版本。
Mac 安装和管理多个Python版本 TinyDolphin
背景在MacOS10.15Catalina即将公测之际，国外技术论坛发表了一篇名为《macOS10.15Catalina弃用UNIX脚本语言》的帖子，其中说到：较旧的Python语言版本2.7在MacOS10.15Catalina中已被弃用，不会包含在MacOS10.16中。其他UNIX脚本语言（Ruby&Perl）也是如此。然后在MacOS10.14以及之前的版本，都是内置的Python2版本。
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户