java远程通信原理

在分布式服务框架中,一个最基础的问题就是远程服务是怎么通讯的,在java领域中有很多可实现远程通讯的技术,例如:rmi、mina、esb、burlap、hessian、soap、ejb和jms 等,这些名词之间到底是些什么关系呢,它们背后到底是基于什么原理实现的呢,了解这些是实现分布式服务框架的基础知识,而如果在性能上有高的要求的话,那深入了解这些技术背后的机制就是必须的了,在这篇blog中我们将来一探究竟,抛砖引玉,欢迎大家提供更多的实现远程通讯的技术和原理的介绍。

基本原理

要实现网络机器间的通讯,首先得来看看计算机系统网络通信的基本原理,在底层层面去看,网络通信需要做的就是将流从一台计算机传输到另外一台计算机,基于传输协议和网络io来实现,其中传输协议比较出名的有http、tcp、udp等等,http、tcp、udp都是在基于socket概念上为某类应用场景而扩展出的传输协议,网络io,主要有bio、nio、aio三种方式,所有的分布式应用通讯都基于这个原理而实现,只是为了应用的易用,各种语言通常都会提供一些更为贴近应用易用的应用层协议。

应用级协议

远程服务通讯,需要达到的目标是在一台计算机发起请求,另外一台机器在接收到请求后进行相应的处理并将结果返回给请求端,这其中又会有诸如one way request、同步请求、异步请求等等请求方式,按照网络通信原理,需要实现这个需要做的就是将请求转换成流,通过传输协议传输至远端,远端计算机在接收到请求的流后进行处理,处理完毕后将结果转化为流,并通过传输协议返回给调用端。
原理是这样的,但为了应用的方便,业界推出了很多基于此原理之上的应用级的协议,使得大家可以不用去直接操作这么底层的东西,通常应用级的远程通信协议会提供:

  1. 为了避免直接做流操作这么麻烦,提供一种更加易用或贴合语言的标准传输格式;
  2. 网络通信机制的实现,就是替你完成了将传输格式转化为流,通过某种传输协议传输至远端计算机,远端计算机在接收到流后转化为传输格式,并进行存储或以某种方式通知远端计算机。

所以在学习应用级的远程通信协议时,我们可以带着这几个问题进行学习:

  1. 传输的标准格式是什么?
  2. 怎么样将请求转化为传输的流?
  3. 怎么接收和处理流?
  4. 传输协议是?

不过应用级的远程通信协议并不会在传输协议上做什么多大的改进,主要是在流操作方面,让应用层生成流和处理流的这个过程更加的贴合所使用的语言或标准,至于传输协议则通常都是可选的,在java领域中知名的有:rmi、xml-rpc、binary-rpc、soap、corba、jms,来具体的看看这些远程通信的应用级协议:

rmi

rmi是个典型的为java定制的远程通信协议,我们都知道,在single vm中,我们可以通过直接调用java object instance来实现通信,那么在远程通信时,如果也能按照这种方式当然是最好了,这种远程通信的机制成为rpc(remote procedure call),rmi正是朝着这个目标而诞生的。

来看下基于rmi的一次完整的远程通信过程的原理:

  1. 客户端发起请求,请求转交至rmi客户端的stub类;
  2. stub类将请求的接口、方法、参数等信息进行序列化;
  3. 基于socket将序列化后的流传输至服务器端;
  4. 服务器端接收到流后转发至相应的skelton类;
  5. skelton类将请求的信息反序列化后调用实际的处理类;
  6. 处理类处理完毕后将结果返回给skelton类;
  7. skelton类将结果序列化,通过socket将流传送给客户端的stub;
  8. stub在接收到流后反序列化,将反序列化后的java object返回给调用者。

根据原理来回答下之前学习应用级协议带着的几个问题:

  1. 传输的标准格式是什么?
    是java objectstream。
  2. 怎么样将请求转化为传输的流?
    基于java串行化机制将请求的java object信息转化为流。
  3. 怎么接收和处理流?
    根据采用的协议启动相应的监听端口,当有流进入后基于java串行化机制将流进行反序列化,并根据rmi协议获取到相应的处理对象信息,进行调用并处理,处理完毕后的结果同样基于java串行化机制进行返回。
  4. 传输协议是?
    socket。

xml-rpc

xml-rpc也是一种和rmi类似的远程调用的协议,它和rmi的不同之处在于它以标准的xml格式来定义请求的信息(请求的对象、方法、参数等),这样的好处是什么呢,就是在跨语言通讯的时候也可以使用。

来看下xml-rpc协议的一次远程通信过程:

  1. 客户端发起请求,按照xml-rpc协议将请求信息进行填充;
  2. 填充完毕后将xml转化为流,通过传输协议进行传输;
  3. 接收到在接收到流后转换为xml,按照xml-rpc协议获取请求的信息并进行处理;
  4. 处理完毕后将结果按照xml-rpc协议写入xml中并返回。

同样来回答问题:

  1. 传输的标准格式是?
    标准格式的xml。
  2. 怎么样将请求转化为传输的流?
    将xml转化为流。
  3. 怎么接收和处理流?
    通过监听的端口获取到请求的流,转化为xml,并根据协议获取请求的信息,进行处理并将结果写入xml中返回。
  4. 传输协议是?
    http。

binary-rpc

binary-rpc看名字就知道和xml-rpc是差不多的了,不同之处仅在于传输的标准格式由xml转为了二进制的格式。

同样来回答问题:

  1. 传输的标准格式是?
    标准格式的二进制文件。
  2. 怎么样将请求转化为传输的流?
    将二进制格式文件转化为流。
  3. 怎么接收和处理流?
    通过监听的端口获取到请求的流,转化为二进制文件,根据协议获取请求的信息,进行处理并将结果写入xml中返回。
  4. 传输协议是?
    http。

soap

soap原意为simple object access protocol,是一个用于分布式环境的、轻量级的、基于xml进行信息交换的通信协议,可以认为soap是xml rpc的高级版,两者的原理完全相同,都是http+xml,不同的仅在于两者定义的xml规范不同,soap也是webservice采用的服务调用协议标准,因此在此就不多加阐述了。

corba

common object request broker architecture(公用对象请求代理[调度]程序体系结构),是一组用来定义“分布式对象系统”的标准,由omg(object menagement group)作为发起和标准制定单位。corba的目的是定义一套协议,符合这个协议的对象可以互相交互,不论它们是用什么样的语言写的,不论它们运行于什么样的机器和操作系统。
corba在我看来是个类似于soa的体系架构,涵盖可选的远程通信协议,但其本身不能列入通信协议这里来讲,而且corba基本淘汰,再加上对corba也不怎么懂,在此就不进行阐述了。

jms

jms呢,是实现java领域远程通信的一种手段和方法,基于jms实现远程通信时和rpc是不同的,虽然可以做到rpc的效果,但因为不是从协议级别定义的,因此我们不认为jms是个rpc协议,但它确实是个远程通信协议,在其他的语言体系中也存在着类似jms的东西,可以统一的将这类机制称为消息机制,而消息机制呢,通常是高并发、分布式领域推荐的一种通信机制,这里的主要一个问题是容错(详细见erlang论文)。

来看jms中的一次远程通信的过程:

  1. 客户端将请求转化为符合jms规定的message;
  2. 通过jms api将message放入jms queue或topic中;
  3. 如为jms queue,则发送中相应的目标queue中,如为topic,则发送给订阅了此topic的jms queue。
  4. 处理端则通过轮训jms queue,来获取消息,接收到消息后根据jms协议来解析message并处理。

回答问题:

  1. 传输的标准格式是?
    jms规定的message。
  2. 怎么样将请求转化为传输的流?
    将参数信息放入message中即可。
  3. 怎么接收和处理流?
    轮训jms queue来接收message,接收到后进行处理,处理完毕后仍然是以message的方式放入queue中发送或multicast。
  4. 传输协议是?
    不限。

基于jms也是常用的实现远程异步调用的方法之一。

可选实现技术

当然,在上面的原理中并没有介绍到所有的java领域可选的远程通信协议了,例如还有ejb采用的ormi、spring自己定义的一个简单的http invoker等等。
看完原理后我们再来看看目前java领域可用于实现远程通讯的框架或library,知名的有:jboss-remoting、spring- remoting、hessian、burlap、xfire(axis)、activemq、mina、mule、ejb3等等,来对每种做个简单的介绍和评价,其实呢,要做分布式服务框架,这些东西都是要有非常深刻的了解的,因为分布式服务框架其实是包含了解决分布式领域以及应用层面领域两方面问题的。
当然,你也可以自己根据远程网络通信原理(transport protocol+net io)去实现自己的通讯框架或library。

那么在了解这些远程通讯的框架或library时,会带着什么问题去学习呢?

  1. 是基于什么协议实现的?
  2. 怎么发起请求?
  3. 怎么将请求转化为符合协议的格式的?
  4. 使用什么传输协议传输?
  5. 响应端基于什么机制来接收请求?
  6. 怎么将流还原为传输格式的?
  7. 处理完毕后怎么回应?

jboss-remoting

jboss-remoting是由jboss编写的一个java领域的远程通讯框架,基于此框架,可以很简单的实现基于多种传输协议的java对象的rpc。

直接来回答问题:

  1. 是基于什么协议实现的?
    jboss-remoting是个通讯框架,因此它支持多种协议方式的通信,例如纯粹的socket+io方式、rmi方式、http+io方式等。
  2. 怎么发起请求?
    在jboss-remoting中,只需将需要发起的请求参数对象传入jboss-remoting的invocationrequest对象即可,也可根据协议基于invocationrequest封装符合需求的invocationrequest对象。
  3. 怎么将请求转化为符合协议的格式的?
    jboss-remoting基于java串行化机制或jboss自己的串行化实现来将请求转化为对象字节流。
  4. 使用什么传输协议传输?
    支持多种传输协议,例如socket、http等。
  5. 响应端基于什么机制来接收请求?
    响应端只需将自己的处理对象注册到jboss-remoting提供的server端的connector对象中即可。
  6. 怎么将流还原为传输格式的?
    jboss-remoting基于java串行化机制或jboss自己的串行化实现来将请求信息还原为java对象。
  7. 处理完毕后怎么回应?
    处理完毕后将结果对象直接返回即可,jboss-remoting会将此对象按照协议进行序列化,返回至调用端。

另外,jboss-remoting支持多种通信方式,例如同步/异步/单向通信等。

spring-remoting

spring-remoting是spring提供java领域的远程通讯框架,基于此框架,同样也可以很简单的将普通的spring bean以某种远程协议的方式来发布,同样也可以配置spring bean为远程调用的bean。

  1. 是基于什么协议实现的?
    和jboss-remoting一样,作为一个远程通讯的框架,spring通过集成多种远程通讯的library,从而实现了对多种协议的支持,例如rmi、http+io、xml-rpc、binary-rpc等。
  2. 怎么发起请求?
    在spring中,由于其对于远程调用的bean采用的是proxy实现,发起请求完全是通过服务接口调用的方式。
  3. 怎么将请求转化为符合协议的格式的?
    spring按照协议方式将请求的对象信息转化为流,例如spring http invoker是基于spring自己定义的一个协议来实现的,传输协议上采用的为http,请求信息是基于java串行化机制转化为流进行传输。
  4. 使用什么传输协议传输?
    支持多种传输协议,例如rmi、http等等。
  5. 响应端基于什么机制来接收请求?
    响应端遵循协议方式来接收请求,对于使用者而言,则只需通过spring的配置方式将普通的spring bean配置为响应端或者说提供服务端。
  6. 怎么将流还原为传输格式的?
    按照协议方式来进行还原。
  7. 处理完毕后怎么回应?
    处理完毕后直接返回即可,spring-remoting将根据协议方式来做相应的序列化。

hessian

hessian是由caucho提供的一个基于binary-rpc实现的远程通讯library。

  1. 是基于什么协议实现的?
    基于binary-rpc协议实现。
  2. 怎么发起请求?
    需通过hessian本身提供的api来发起请求。
  3. 怎么将请求转化为符合协议的格式的?
    hessian通过其自定义的串行化机制将请求信息进行序列化,产生二进制流。
  4. 使用什么传输协议传输?
    hessian基于http协议进行传输。
  5. 响应端基于什么机制来接收请求?
    响应端根据hessian提供的api来接收请求。
  6. 怎么将流还原为传输格式的?
    hessian根据其私有的串行化机制来将请求信息进行反序列化,传递给使用者时已是相应的请求信息对象了。
  7. 处理完毕后怎么回应?
    处理完毕后直接返回,hessian将结果对象进行序列化,传输至调用端。

burlap

burlap也是有caucho提供,它和hessian的不同在于,它是基于xml-rpc协议的。

  1. 是基于什么协议实现的?
    基于xml-rpc协议实现。
  2. 怎么发起请求?
    根据burlap提供的api。
  3. 怎么将请求转化为符合协议的格式的?
    将请求信息转化为符合协议的xml格式,转化为流进行传输。
  4. 使用什么传输协议传输?
    http协议。
  5. 响应端基于什么机制来接收请求?
    监听http请求。
  6. 怎么将流还原为传输格式的?
    根据xml-rpc协议进行还原。
  7. 处理完毕后怎么回应?
    返回结果写入xml中,由burlap返回至调用端。

xfire、axis

xfire、axis是webservice的实现框架,webservice可算是一个完整的soa架构实现标准了,因此采用xfire、axis这些也就意味着是采用webservice方式了。

  1. 是基于什么协议实现的?
    基于soap协议。
  2. 怎么发起请求?
    获取到远端service的proxy后直接调用。
  3. 怎么将请求转化为符合协议的格式的?
    将请求信息转化为遵循soap协议的xml格式,由框架转化为流进行传输。
  4. 使用什么传输协议传输?
    http协议。
  5. 响应端基于什么机制来接收请求?
    监听http请求。
  6. 怎么将流还原为传输格式的?
    根据soap协议进行还原。
  7. 处理完毕后怎么回应?
    返回结果写入xml中,由框架返回至调用端。

activemq

activemq是jms的实现,基于jms这类消息机制实现远程通讯是一种不错的选择,毕竟消息机制本身的功能使得基于它可以很容易的去实现同步/异步/单向调用等,而且消息机制从容错角度上来说也是个不错的选择,这是erlang能够做到容错的重要基础。

  1. 是基于什么协议实现的?
    基于jms协议。
  2. 怎么发起请求?
    遵循jms api发起请求。
  3. 怎么将请求转化为符合协议的格式的?
    不太清楚,猜想应该是二进制流。
  4. 使用什么传输协议传输?
    支持多种传输协议,例如socket、http等等。
  5. 响应端基于什么机制来接收请求?
    监听符合协议的端口。
  6. 怎么将流还原为传输格式的?
    同问题3。
  7. 处理完毕后怎么回应?
    遵循jms api生成消息,并写入jms queue中。

基于jms此类机制实现远程通讯的例子有spring-intergration、mule、lingo等等。

mina

mina是apache提供的通讯框架,在之前一直没有提到网络io这块,之前提及的框架或library基本都是基于bio的,而mina是采用 nio的,nio在并发量增长时对比bio而言会有明显的性能提升,而java性能的提升,与其nio这块与os的紧密结合是有不小的关系的。

  1. 是基于什么协议实现的?
    基于纯粹的socket+nio。
  2. 怎么发起请求?
    通过mina提供的client api。
  3. 怎么将请求转化为符合协议的格式的?
    mina遵循java串行化机制对请求对象进行序列化。
  4. 使用什么传输协议传输?
    支持多种传输协议,例如socket、http等等。
  5. 响应端基于什么机制来接收请求?
    以nio的方式监听协议端口。
  6. 怎么将流还原为传输格式的?
    遵循java串行化机制对请求对象进行反序列化。
  7. 处理完毕后怎么回应?
    遵循mina api进行返回。

mina是nio方式的,因此支持异步调用是毫无悬念的。

ejb

ejb最突出的在于其分布式,ejb采用的是ormi协议,和rmi协议是差不多的,但ejb在分布式通讯的安全控制、transport pool、smart proxy等方面的突出使得其在分布式领域是不可忽视的力量。

  1. 是基于什么协议实现的?
    基于ormi协议。
  2. 怎么发起请求?
    ejb调用。
  3. 怎么将请求转化为符合协议的格式的?
    遵循java串行化机制对请求对象进行序列化。
  4. 使用什么传输协议传输?
    socket。
  5. 响应端基于什么机制来接收请求?
    监听协议端口。
  6. 怎么将流还原为传输格式的?
    遵循java串行化机制对请求对象进行反序列化。
  7. 处理完毕后怎么回应?
    直接返回处理对象即可。

在之前的分布式服务框架系列的文章中对于jndi有误导的嫌疑,在这篇blog中也顺带的提下jndi的机制,由于jndi取决于具体的实现,在这里只能是讲解下jboss的jndi的实现了。

在将对象实例绑定到jboss jnp server后,当远程端采用context.lookup()方式获取远程对象实例并开始调用时,jboss jndi的实现方法是从jnp server上获取对象实例,将其序列化回本地,然后在本地进行反序列化,之后在本地进行类调用。
通过这个机制,就可以知道了,本地其实是必须有绑定到jboss上的对象实例的class的,否则反序列化的时候肯定就失败了,而远程通讯需要做到的是在远程执行某动作,并获取到相应的结果,可见纯粹基于jndi是无法实现远程通讯的。
但jndi也是实现分布式服务框架一个很关键的技术点,因为可以通过它来实现透明化的远端和本地调用,就像ejb,另外它也是个很好的隐藏实际部署机制(就像datasource)等的方案。

总结

由上一系列的分析可知,在远程通讯领域中,涉及的知识点还是相当的多的,例如有:通信协议(socket/tcp/http/udp/rmi /xml-rpc etc.)、消息机制、网络io(bio/nio/aio)、multithread、本地调用与远程调用的透明化方案(涉及java classloader、dynamic proxy、unit test etc.)、异步与同步调用、网络通信处理机制(自动重连、广播、异常、池处理等等)、java serialization (各种协议的私有序列化机制等)、各种框架的实现原理(传输格式、如何将传输格式转化为流的、如何将请求信息转化为传输格式的、如何接收流的、如何将流还原为传输格式的等等),要精通其中的哪些东西,得根据实际需求来决定了,只有在了解了原理的情况下才能很容易的做出选择,甚至可以根据需求做私有的远程通讯协议,对于从事分布式服务平台或开发较大型的分布式应用的人而言,我觉得至少上面提及的知识点是需要比较了解的。

参考文档(感谢这些文章)

你可能感兴趣的:(java,spring,webservice,jms,通讯,服务框架)