Dubbo是阿里巴巴SOA服务化治理方案的核心框架,是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案。
主要使用协议有
(dubbo 、rmi、hessian、http、webservice、thrift、memcached、redis)
dubbo:
Dubbo 缺省协议采用单一长连接和 NIO 异步通讯,适合于小数据量大并发的服务调用,以及服务消费者机器数远大于服务提供者机器数的情况。
反之,Dubbo 缺省协议不适合传送大数据量的服务,比如传文件,传视频等,除非请求量很低。
缺省协议,使用基于 mina 1.1.7 和 hessian 3.2.1 的 tbremoting 交互。
l 连接个数:单连接
l 连接方式:长连接
l 传输协议:TCP
l 传输方式:NIO 异步传输
l 序列化:Hessian 二进制序列化
l 适用范围:传入传出参数数据包较小(建议小于100K),消费者比提供者个数多,单一消费者无法压满提供者,尽量不要用 dubbo 协议传输大文件或超大字符串。
l 适用场景:常规远程服务方法调用
rmi:
l 连接个数:多连接
l 连接方式:短连接
l 传输协议:TCP
l 传输方式:同步传输
l 序列化:Java 标准二进制序列化
l 适用范围:传入传出参数数据包大小混合,消费者与提供者个数差不多,可传文件。
l 适用场景:常规远程服务方法调用,与原生RMI服务互操作
Hessian:
l 连接个数:多连接
l 连接方式:短连接
l 传输协议:HTTP
l 传输方式:同步传输
l 序列化:Hessian二进制序列化
l 适用范围:传入传出参数数据包较大,提供者比消费者个数多,提供者压力较大,可传文件。
l 适用场景:页面传输,文件传输,或与原生hessian服务互操作
Http:
l 连接个数:多连接
l 连接方式:短连接
l 传输协议:HTTP
l 传输方式:同步传输
l 序列化:表单序列化
l 适用范围:传入传出参数数据包大小混合,提供者比消费者个数多,可用浏览器查看,可用表单或URL传入参数,暂不支持传文件。
l 适用场景:需同时给应用程序和浏览器 JS 使用的服务。
Webservice:
l 连接个数:多连接
l 连接方式:短连接
l 传输协议:HTTP
l 传输方式:同步传输
l 序列化:SOAP 文本序列化
l 适用场景:系统集成,跨语言调用
Thrift
Memcached
Redis
(官网介绍)
一般服务端服务器比较少,消费端有可能会有很多项目或者工程会调用dubbo的接口,而且数据量传输较小且并发量比较高的情况下用dubbo效率会很高。
在集群负载均衡时,Dubbo 提供了多种均衡策略,缺省为 random 随机调用。
可以自行扩展负载均衡策略,参见:负载均衡扩展
负载均衡策略有( 随机、轮循、最少活跃调用数、一致性Hash)
Random LoadBalance
随机,按权重设置随机概率。
在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有利于动态调整提供者权重。
RoundRobin LoadBalance
轮循,按公约后的权重设置轮循比率。
存在慢的提供者累积请求的问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在那,久而久之,所有请求都卡在调到第二台上。
LeastActive LoadBalance
最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。
使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。
ConsistentHash LoadBalance
一致性 Hash,相同参数的请求总是发到同一提供者。
当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。
算法参见:http://en.wikipedia.org/wiki/Consistent_hashing
缺省只对第一个参数 Hash,如果要修改,请配置
缺省用 160 份虚拟节点,如果要修改,请配置
配置
服务端服务级别
客户端服务级别
服务端方法级别
客户端方法级别
(官网地址)dubbo注册中心配置主要通过
多注册中心: Dubbo 支持同一服务向多注册中心同时注册,或者不同服务分别注册到不同的注册中心上去,甚至可以同时引用注册在不同注册中心上的同名服务。(详情官网)
在开发及测试环境下,经常需要绕过注册中心,只测试指定服务提供者,这时候可能需要点对点直连,
点对点直联方式,将以服务接口为单位,忽略注册中心的提供者列表,
服务注册中心,动态的注册和发现服务,使服务的位置透明,并通过在消费方获取服务提供方地址列表,实现软负载均衡和Failover, 注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。
服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。注册中心负责服务地址的注册与查找,相当于目录服务,服务提供者和消费者只在启动时与注册中心交互,注册中心不转发请求,服务消费者向注册中心获取服务提供者地址列表,并根据负载算法直接调用提供者,注册中心,服务提供者,服务消费者三者之间均为长连接,监控中心除外,注册中心通过长连接感知服务提供者的存在,服务提供者宕机,注册中心将立即推送事件通知消费者
注册中心和监控中心全部宕机,不影响已运行的提供者和消费者,消费者在本地缓存了提供者列表
注册中心和监控中心都是可选的,服务消费者可以直连服务提供者
Dubbo通过Token令牌防止用户绕过注册中心直连,然后在注册中心上管理授权。Dubbo还提供服务黑白名单,来控制服务所允许的调用方。
可以的,启动dubbo时,消费者会从zk拉取注册的生产者的地址接口等数据,缓存在本地。每次调用时,按照本地存储的地址进行调用 。 (推荐用法--配置Dubbo缓存文件)
zookeeper采用了递增的事务Id来标识,所有的proposal都在被提出的时候加上了zxid,zxid实际上是一个64位的数字,高32位是epoch用来标识leader是否发生改变,如果有新的leader产生出来,epoch会自增,低32位用来递增计数。当新产生proposal的时候,会依据数据库的两阶段过程,首先会向其他的server发出事务执行请求,如果超过半数的机器都能执行并且能够成功,那么就会开始执行
其他深入课题:
《超时原理以及应用场景》
《Dubbo开发问题汇总》
《分布式事务TCC》
《基于Dubbo的分布式事务框架 LCN》
《分布式系统互斥性与幂等性问题的分析与解决》