gRPC 服务调用原理

  1. 常用的服务调用方式
    1.1 同步服务调用
    1.2 并行服务调用
    1.3 异步服务调用
  2. 服务调用的一些误区和典型问题
    2.1 理解误区
    2.1.1 I/O 异步服务就是异步
    2.1.2 服务调用天生就是同步的
    2.1.3 异步服务调用性能更高
    2.2 Restful API 的潜在性能风险
    2.2.1 HTTP1.X 的性能问题
    2.2.2 异步非阻塞 I/O 的 HTTP 协议栈
    2.2.3 推荐解决方案
  3. gRPC 服务调用
    3.1 普通 RPC 调用
    3.1.1 同步阻塞式 RPC 调用
    3.1.2 基于 Future 的异步 RPC 调用
    3.1.3 Reactive 风格异步 RPC 调用
    3.2 Streaming 模式服务调用
    3.2.1 服务端 streaming
    3.2.2 客户端 streaming
    3.2.3 双向 streaming
    3.3 总结

1. 常用的服务调用方式

无论是 RPC 框架,还是当前比较流行的微服务框架,通常都会提供多种服务调用方式,以满足不同业务场景的需求,比较常用的服务调用方式如下:

  • 同步服务调用:最常用的服务调用方式,开发比较简单,比较符合编程人员的习惯,代码相对容易维护些;
  • 并行服务调用:对于无上下文依赖的多个服务,可以一次并行发起多个调用,这样可以有效降低服务调用的时延;
  • 异步服务调用:客户端发起服务调用之后,不同步等待响应,而是注册监听器或者回调函数,待接收到响应之后发起异步回调,驱动业务流程继续执行,比较常用的有 Reactive 响应式编程和 JDK 的 Future-Listener 回调机制。

下面我们分别对上述几种服务调用方式进行讲解。

1.1 同步服务调用

同步服务调用是最常用的一种服务调用方式,它的工作原理和使用都非常简单,RPC/ 微服务框架默认都支持该调用形式。

同步服务调用的工作原理如下:客户端发起 RPC 调用,将请求消息路由到 I/O 线程,无论 I/O 线程是同步还是异步发送消息,发起调用的业务线程都会同步阻塞,等待服务端的应答,由 I/O 线程唤醒同步等待的业务线程,获取应答,然后业务流程继续执行。它的工作原理图如下所示:
gRPC 服务调用原理_第1张图片
第 1 步,消费者调用服务端发布的接口,接口调用由服务框架包装成动态代理,发起远程服务调用。

第 2 步,通信框架的 I/O 线程通过网络将请求消息发送给服务端。

第 3 步,消费者业务线程调用通信框架的消息发送接口之后,直接或者间接调用 wait() 方法,同步阻塞等待应答。(备注:与步骤 2 无严格* 的顺序先后关闭,不同框架实现策略不同)。

第 4 步,服务端返回应答消息给消费者,由通信框架负责应答消息的反序列化。

第 5 步,I/O 线程获取到应答消息之后,根据消息上下文找到之前同步阻塞的业务线程,notify() 阻塞的业务线程,返回应答给消费者,完成服务调用。

同步服务调用会阻塞调用方的业务线程,为了防止服务端长时间不返回应答消息导致客户端用户线程被挂死,业务线程等待的时候需要设置超时时间,超时时间的取值需要综合考虑业务端到端的时延控制目标,以及自身的可靠性,超时时间不宜设置过大或者过小, 通常在几百毫秒到几秒之间。

1.2 并行服务调用

在大多数业务应用中,服务总是被串行的调用和执行,例如 A 业务调用 B 服务,B 服务又调用 C 服务,最后形成一个串行的服务调用链:A 业务 — B 服务 — C 服务…

串行服务调用代码比较简单,便于开发和维护,但在一些时延敏感型的业务场景中,需要采用并行服务调用来降低时延,比较典型的场景如下:

  • 多个服务之间逻辑上不存在上下文依赖关系,执行先后顺序没有严格的要求,逻辑上可以被并行执行;
  • 长流程业务,调用多个服务,对时延比较敏感,其中有部分服务逻辑上无上下文关联,可以被并行调用。

并行服务调用的主要目标有两个:

  • 降低业务 E2E 时延。
  • 提升整个系统的吞吐量。

以游戏业务中购买道具流程为例,对并行服务调用的价值进行说明:
gRPC 服务调用原理_第2张图片
在购买道具时,三个鉴权流程实际可以并行执行,最终执行结果做个 Join 即可。如果采用传统的串行服务调用,耗时将是三个鉴权服务时延之和,显然是没有必要的。

计费之后的通知类服务亦如此(注意:通知服务也可以使用 MQ 做订阅 / 发布),单个服务的串行调用会导致购买道具时延比较长,影响游戏玩家的体验。

要解决串行调用效率低的问题,有两个解决对策:

  • 并行服务调用,一次 I/O 操作,可以发起批量调用,然后同步等待响应;
  • 异步服务调用,在同一个业务线程中异步执行多个服务调用,不阻塞业务线程。

采用并行服务调用的伪代码示例:

ParallelFuture future = ParallelService.invoke(serviceName [], methodName[], args []);
List<Object> results = future.get(timeout);// 同步阻塞式获取批量服务调用的响应列表

采用并行服务调用之后,它的总耗时为并行服务调用中耗时最大的服务的执行时间,即 T = Max(T(服务 A),T(服务 B),T(服务 C)),如果采用同步串行服务调用,则总耗时为并行调用的各个服务耗时之和,即:T = T(服务 A) + T(服务 B) + T(服务 C)。服务调用越多,并行服务调用的优势越明显。

并行服务调用的一种实现策略如下所示:
gRPC 服务调用原理_第3张图片
第 1 步,服务框架提供批量服务调用接口供消费者使用,它的定义样例如下:ParallelService.invoke(serviceName [], methodName[], args []);

第 2 步,平台的并行服务调用器创建并行 Future,缓存批量服务调用上下文信息;

第 3 步,并行服务调用器循环调用普通的 Invoker,通过循环的方式执行单个服务调用,获取到单个服务的 Future 之后设置到 Parallel Future 中;

第 4 步,返回 Parallel Future 给消费者;

第 5 步,普通 Invoker 调用通信框架的消息发送接口,发起远程服务调用;

第 6 步,服务端返回应答,通信框架对报文做反序列化,转换成业务对象更新 Parallel Future 的结果列表;

第 7 步,消费者调用 Parallel Future 的 get(timeout) 方法, 同步阻塞,等待所有结果全部返回;

第 8 步,Parallel Future 通过对结果集进行判断,看所有服务调用是否都已经完成(包括成功、失败和异常);

第 9 步,所有批量服务调用结果都已经返回,notify 消费者线程,消费者获取到结果列表,完成批量服务调用,流程继续执行。

通过批量服务调用 + Future 机制,可以实现并行服务调用,由于在调用过程中没有创建新的线程,用户就不需要担心依赖线程上下文的功能发生异常。

1.3 异步服务调用

JDK 原生的 Future 主要用于异步操作,它代表了异步操作的执行结果,用户可以通过调用它的 get 方法获取结果。如果当前操作没有执行完,get 操作将阻塞调用线程:
gRPC 服务调用原理_第4张图片
在实际项目中,往往会扩展 JDK 的 Future,提供 Future-Listener 机制,它支持主动获取和被动异步回调通知两种模式,适用于不同的业务场景。

异步服务调用的工作原理如下:
gRPC 服务调用原理_第5张图片
异步服务调用的工作流程如下:

第 1 步,消费者调用服务端发布的接口,接口调用由服务框架包装成动态代理,发起远程服务调用;
第 2 步,通信框架异步发送请求消息,如果没有发生 I/O 异常,返回;
第 3 步,请求消息发送成功后,I/O 线程构造 Future 对象,设置到 RPC 上下文中;
第 4 步,业务线程通过 RPC 上下文获取 Future 对象;
第 5 步,构造 Listener 对象,将其添加到 Future 中,用于服务端应答异步回调通知;
第 6 步,业务线程返回,不阻塞等待应答;
第 7 步,服务端返回应答消息,通信框架负责反序列化等;
第 8 步,I/O 线程将应答设置到 Future 对象的操作结果中;
第 9 步,Future 对象扫描注册的监听器列表,循环调用监听器的 operationComplete 方法,将结果通知给监听器,监听器获取到结果之后,继续后续业务逻辑的执行,异步服务调用结束。

异步服务调用相比于同步服务调用有两个优点:

  • 化串行为并行,提升服务调用效率,减少业务线程阻塞时间。
  • 化同步为异步,避免业务线程阻塞。

基于 Future-Listener 的纯异步服务调用代码示例如下:

xxxService1.xxxMethod(Req);
Future f1 = RpcContext.getContext().getFuture();
Listener l = new xxxListener();
f1.addListener(l);

class xxxListener {
public void operationComplete(F future) { 
    // 判断是否执行成功,执行后续业务流程
}

2. 服务调用的一些误区和典型问题

对于服务调用方式的理解,容易出现各种误区,例如把 I/O 异步与服务调用的异步混淆起来,认为异步服务调用一定性能更高等。

另外,由于 Restful 风格 API 的盛行,很多 RPC/ 微服务框架开始支持 Restful API,而且通常都是基于 HTTP/1.0/1.1 协议实现的。对于内部的 RPC 调用,使用 HTTP/1.0/1.1 协议代替 TCP 私有协议,可能会带来一些潜在的性能风险,需要在开放性、标准性以及性能成本上综合考虑,谨慎选择。

2.1 理解误区

2.1.1 I/O 异步服务就是异步

实际上,通信框架基于 NIO 实现,并不意味着服务框架就支持异步服务调用了,两者本质上不是同一个层面的事情。在 RPC/ 微服务框架中,引入 NIO 带来的好处是显而易见的:

  • 所有的 I/O 操作都是非阻塞的,避免有限的 I/O 线程因为网络、对方处理慢等原因被阻塞;
  • 多路复用的 Reactor 线程模型:基于 Linux 的 epoll 和 Selector,一个 I/O 线程可以并行处理成百上千条链路,解决了传统同步 I/O 通信线程膨胀的问题。

NIO 只解决了通信层面的异步问题,跟服务调用的异步没有必然关系,也就是说,即便采用传统的 BIO 通信,依然可以实现异步服务调用,只不过通信效率和可靠性比较差而已。

对异步服务调用和通信框架的关系进行说明:
gRPC 服务调用原理_第6张图片
用户发起远程服务调用之后,经历层层业务逻辑处理、消息编码,最终序列化后的消息会被放入到通信框架的消息队列中。业务线程可以选择同步等待、也可以选择直接返回,通过消息队列的方式实现业务层和通信层的分离是比较成熟、典型的做法,目前主流的 RPC 框架或者 Web 服务器很少直接使用业务线程进行网络读写。

通过上图可以看出,采用 NIO 还是 BIO 对上层的业务是不可见的,双方的汇聚点就是消息队列,在 Java 实现中它通常就是个 Queue。业务线程将消息放入到发送队列中,可以选择主动等待或者立即返回,跟通信框架是否是 NIO 没有任何关系。因此不能认为 I/O 异步就代表服务调用也是异步的。

2.1.2 服务调用天生就是同步的

RPC/ 微服务框架的一个目标就是让用户像调用本地方法一样调用远程服务,而不需要关心服务提供者部署在哪里,以及部署形态(透明化调用)。由于本地方法通常都是同步调用,所以服务调用也应该是同步的。

从服务调用形式上看,主要包含 3 种:

  • one way 方式:只有请求,没有应答。例如通知消息。
  • 请求 - 响应方式:一请求一应答,这种方式比较常用。
  • 请求 - 响应 - 异步通知方式:客户端发送请求之后,服务端接收到就立即返回应答,类似 TCP 的 ACK。业务接口层面的响应通过异步通知的方式告知请求方。例如电商类的支付接口、充值缴费接口等。

OneWay 方式的调用示意图如下:
gRPC 服务调用原理_第7张图片
请求 - 应答模式最常用,例如 HTTP 协议,就是典型的请求 - 应答方式:
gRPC 服务调用原理_第8张图片
请求 - 响应 - 异步通知方式流程:通过流程设计,将执行时间可能较长的服务接口从流程上设计成异步。通常在服务调用时请求方携带回调的通知地址,服务端接收到请求之后立即返回应答,表示该请求已经被接收处理。当服务调用真正完成之后,再通过回调地址反向调用服务消费端,将响应通知异步返回。通过接口层的异步,来实现整个服务调用流程的异步,降低了异步调用的开发难度。
gRPC 服务调用原理_第9张图片
One way 方式的服务调用由于不需要返回应答,因此也很容易被设计成异步的:消费者发起远程服务调用之后,立即返回,不需要同步阻塞等待应答。

对于请求 - 响应方式,一般的观点都认为消费者必需要等待服务端响应,拿到结果之后才能返回,否则结果从哪里取?即便业务线程不阻塞,没有获取到结果流程还是无法继续执行下去。

从逻辑上看,上述观点没有问题。但实际上,同步阻塞等待应答并非是唯一的技术选择,我们也可以利用 Java 的 Future-Listener 机制来实现异步服务调用。从业务角度看,它的效果与同步等待等价,但是从技术层面看,却是个很大的进步,它可以保证业务线程在不同步阻塞的情况下实现同步等待的效果,服务执行效率更高。

即接口层面请求 - 响应式定义与具体的技术实现无关,选择同步还是异步服务调用,取决于技术实现。当然,异步通知类接口,从技术实现上做异步更容易些。

2.1.3 异步服务调用性能更高

对于 I/O 密集型,资源不是瓶颈,大部分时间都在同步等应答的场景,异步服务调用会带来巨大的吞吐量提升,资源使用率也可以提高,更加充分的利用硬件资源提升性能。

另外,对于时延不稳定的接口,例如依赖第三方服务的响应速度、数据库操作类等,通常异步服务调用也会带来性能提升。

但是,如果接口调用时延本身都非常小(例如毫秒级),内存计算型,不依赖第三方服务,内部也没有 I/O 操作,则异步服务调用并不会提升性能。能否提升性能,主要取决于业务的应用场景。

2.2 Restful API 的潜在性能风险

使用 Restful API 可以带来很多收益:

  • API 接口更加规范和标准,可以通过 Swagger API 规范来描述服务接口,并生成客户端和服务端代码;
  • Restful API 可读性更好,也更容易维护;
  • 服务提供者和消费者基于 API 契约,双方可以解耦,不需要在客户端引入 SDK 和类库的直接依赖,未来的独立升级也更方便;
  • 内外可以使用同一套 API,非常容易开放给外部或者合作伙伴使用,而不是对内和对外维护两套不同协议的 API。

通常,对外开放的 API 使用 Restful 是通用的做法,但是在系统内部,例如商品中心和订单中心,RPC 调用使用 Restful 风格的 API 作为微服务的 API,却可能存在性能风险。

2.2.1 HTTP1.X 的性能问题

如果 HTTP 服务器采用同步阻塞 I/O,例如 Tomcat5.5 之前的 BIO 模型,如下图所示:
gRPC 服务调用原理_第10张图片
就会存在如下几个问题:

  • 性能问题:一连接一线程模型导致服务端的并发接入数和系统吞吐量受到极大限制;
  • 可靠性问题:由于 I/O 操作采用同步阻塞模式,当网络拥塞或者通信对端处理缓慢会导致 I/O 线程被挂住,阻塞时间无法预测;
  • 可维护性问题:I/O 线程数无法有效控制、资源无法有效共享(多线程并发问题),系统可维护性差。

显然,如果采用的 Restful API 底层使用的 HTTP 协议栈是同步阻塞 I/O,则服务端的处理性能将大打折扣。

2.2.2 异步非阻塞 I/O 的 HTTP 协议栈

如果 HTTP 协议栈采用了异步非阻塞 I/O 模型(例如 Netty、Servlet3.X 版本),则可以解决同步阻塞 I/O 的问题,带来如下收益:

  • 同一个 I/O 线程可以并行处理多个客户端链接,有效降低了 I/O 线程数量,提升了资源调度利用率;
  • 读写操作都是非阻塞的,不会因为对端处理慢、网络时延大等导致的 I/O 线程被阻塞。

相比于 TCP 类协议,例如 Thrift, 采用了非阻塞 I/O 的 HTTP/1.X 协议仍然存在性能问题,原因如下所示:
gRPC 服务调用原理_第11张图片
由于 HTTP 协议是无状态的,客户端发送请求之后,必须等待接收到服务端响应之后,才能继续发送请求(非 websocket、pipeline 等模式)。

在某一个时刻,链路上只存在单向的消息流,实际上把 TCP 的双工变成了单工模式。如果服务端响应耗时较大,则单个 HTTP 链路的通信性能严重下降,只能通过不断的新建连接来提升 I/O 性能。

但这也会带来很多副作用,例如句柄数的增加、I/O 线程的负载加重等。显而易见,修 8 条单向车道的成本远远高于修一条双向 8 车道的成本。

除了无状态导致的链路传输性能差之外,HTTP/1.X 还存在如下几个影响性能的问题:

  • HTTP 客户端超时之后,由于协议是无状态的,客户端无法对请求和响应进行关联,只能关闭链路重连,反复的建链会增加成本开销和时延(如果客户端选择不关闭链路,继续发送新的请求,服务端可能会把上一条客户端认为超时的响应返回回去,也可能按照 HTTP 协议规范直接关闭链路,无路哪种处理,都会导致链路被关闭)。如果采用传统的 RPC 私有协议,请求和响应可以通过消息 ID 或者会话 ID 做关联,某条消息的超时并不需要关闭链路,只需要丢弃该消息重发即可。
  • HTTP 本身包含文本类型的协议消息头,占用一些字节,另外,采用 JSON 类文本的序列化方式,报文相比于传统的私有 RPC 协议也大很多,降低了传输性能。
  • 服务端无法主动推送响应。

如果业务对性能和资源成本要求非常苛刻,在选择使用基于 HTTP/1.X 的 Restful API 代替私有 RPC API(通常是基于 TCP 的二进制私有协议)时就要三思。反之,如果业务对性能要求较低,或者在硬件成本和开放性、规范性上更看重后者,则使用 Restful API 也无妨。

2.2.3 推荐解决方案

如果选择 Restful API 作为内部 RPC 或者微服务的接口协议,则建议使用 HTTP/2.0 协议来承载,它的优点如下:支持双向流、消息头压缩、单 TCP 的多路复用、服务端推送等特性。可以有效解决传统 HTTP/1.X 协议遇到的问题,效果与 RPC 的 TCP 私有协议接近。

3. gRPC 服务调用

gRPC 的通信协议基于标准的 HTTP/2 设计,主要提供了两种 RPC 调用方式:

  • 普通 RPC 调用方式,即请求 - 响应模式。
  • 基于 HTTP/2.0 的 streaming 调用方式。

3.1 普通 RPC 调用

普通的 RPC 调用提供了三种实现方式:

  • 同步阻塞式服务调用,通常实现类是 xxxBlockingStub(基于 proto 定义生成)。
  • 异步非阻塞调用,基于 Future-Listener 机制,通常实现类是 xxxFutureStub。
  • 异步非阻塞调用,基于 Reactive 的响应式编程模式,通常实现类是 xxxStub。

3.1.1 同步阻塞式 RPC 调用

同步阻塞式服务调用,代码示例如下(HelloWorldClient 类):

 blockingStub = GreeterGrpc.newBlockingStub(channel);
 ...
 HelloRequest request 
= HelloRequest.newBuilder().setName(name).build();
    HelloReply response;
    try {
      response = blockingStub.sayHello(request);

创建 GreeterBlockingStub,然后调用它的 sayHello,此时会阻塞调用方线程(例如 main 函数),直到收到服务端响应之后,业务代码继续执行,打印响应日志。

实际上,同步服务调用是由 gRPC 框架的 ClientCalls 在框架层做了封装,异步发起服务调用之后,同步阻塞调用方线程,直到收到响应再唤醒被阻塞的业务线程,源码如下(ClientCalls 类):

try {
      ListenableFuture<RespT> responseFuture = futureUnaryCall(call, param);
      while (!responseFuture.isDone()) {
        try {
          executor.waitAndDrain();
        } catch (InterruptedException e) {
          Thread.currentThread().interrupt();
          throw Status.CANCELLED.withCause(e).asRuntimeException();
        }

判断当前操作是否完成,如果没完成,则在 ThreadlessExecutor 中阻塞(阻塞调用方线程,ThreadlessExecutor 不是真正的线程池),代码如下(ThreadlessExecutor 类):

Runnable runnable = queue.take();
      while (runnable != null) {
        try {
          runnable.run();
        } catch (Throwable t) {
          log.log(Level.WARNING, "Runnable threw exception", t);
        }
        runnable = queue.poll();
      }

调用 queue 的 take 方法会阻塞,直到队列中有消息 (响应),才会继续执行(BlockingQueue 类):

/**
     * Retrieves and removes the head of this queue, waiting if necessary
     * until an element becomes available.
     *
     * @return the head of this queue
     * @throws InterruptedException if interrupted while waiting
     */
    E take() throws InterruptedException;

3.1.2 基于 Future 的异步 RPC 调用

业务调用代码示例如下(HelloWorldClient 类):

HelloRequest request 
= HelloRequest.newBuilder().setName(name).build();
    try {
   com.google.common.util.concurrent.ListenableFuture<io.grpc.examples.helloworld.HelloReply>
              listenableFuture = futureStub.sayHello(request);
      Futures.addCallback(listenableFuture, new FutureCallback<HelloReply>() {
        @Override
        public void onSuccess(@Nullable HelloReply result) {
          logger.info("Greeting: " + result.getMessage());
        }

调用 GreeterFutureStub 的 sayHello 方法返回的不是应答,而是 ListenableFuture,它继承自 JDK 的 Future,接口定义如下:

@GwtCompatible
public interface ListenableFuture<V> extends Future<V> 

将 ListenableFuture 加入到 gRPC 的 Future 列表中,创建一个新的 FutureCallback 对象,当 ListenableFuture 获取到响应之后,gRPC 的 DirectExecutor 线程池会调用新创建的 FutureCallback,执行 onSuccess 或者 onFailure,实现异步回调通知。

接着我们分析下 ListenableFuture 的实现原理,ListenableFuture 的具体实现类是 GrpcFuture,代码如下(ClientCalls 类):

public static <ReqT, RespT> ListenableFuture<RespT> futureUnaryCall(
      ClientCall<ReqT, RespT> call,
      ReqT param) {
    GrpcFuture<RespT> responseFuture = new GrpcFuture<RespT>(call);
    asyncUnaryRequestCall(call, param, new UnaryStreamToFuture<RespT>(responseFuture), false);
    return responseFuture;
  }

获取到响应之后,调用 complete 方法(AbstractFuture 类):

private void complete() {
    for (Waiter currentWaiter = clearWaiters();
        currentWaiter != null;
        currentWaiter = currentWaiter.next) {
      currentWaiter.unpark();
    }

将 ListenableFuture 加入到 Future 列表中之后,同步获取响应(在 gRPC 线程池中阻塞,非业务调用方线程)(Futures 类):

public static <V> V getUninterruptibly(Future<V> future)
      throws ExecutionException {
    boolean interrupted = false;
    try {
      while (true) {
        try {
          return future.get();
        } catch (InterruptedException e) {
          interrupted = true;
        }
      }

获取到响应之后,回调 callback 的 onSuccess,代码如下(Futures 类):

 value = getUninterruptibly(future);
        } catch (ExecutionException e) {
          callback.onFailure(e.getCause());
          return;
        } catch (RuntimeException e) {
          callback.onFailure(e);
          return;
        } catch (Error e) {
          callback.onFailure(e);
          return;
        }
        callback.onSuccess(value);

除了将 ListenableFuture 加入到 Futures 中由 gRPC 的线程池执行异步回调,也可以自定义线程池执行异步回调,代码示例如下(HelloWorldClient 类):

listenableFuture.addListener(new Runnable() {
        @Override
        public void run() {
          try {
            HelloReply response = listenableFuture.get();
            logger.info("Greeting: " + response.getMessage());
          }
          catch(Exception e)
          {
            e.printStackTrace();
          }
        }
      }, Executors.newFixedThreadPool(1));

3.1.3 Reactive 风格异步 RPC 调用

业务调用代码示例如下(HelloWorldClient 类):

HelloRequest request = HelloRequest.newBuilder().setName(name).build();
    io.grpc.stub.StreamObserver<io.grpc.examples.helloworld.HelloReply> responseObserver =
            new io.grpc.stub.StreamObserver<io.grpc.examples.helloworld.HelloReply>()
            {
                public  void onNext(HelloReply value)
               {
                   logger.info("Greeting: " + value.getMessage());
               }
                public void onError(Throwable t){
                    logger.warning(t.getMessage());
                }
                public void onCompleted(){}
            };
           stub.sayHello(request,responseObserver);

构造响应 StreamObserver,通过响应式编程,处理正常和异常回调,接口定义如下:
在这里插入图片描述
将响应 StreamObserver 作为入参传递到异步服务调用中,该方法返回空,程序继续向下执行,不阻塞当前业务线程,代码如下所示(GreeterGrpc.GreeterStub):

public void sayHello(io.grpc.examples.helloworld.HelloRequest request,
        io.grpc.stub.StreamObserver<io.grpc.examples.helloworld.HelloReply> responseObserver) {
      asyncUnaryCall(
          getChannel().newCall(METHOD_SAY_HELLO, getCallOptions()), request, responseObserver);
    }

下面分析下基于 Reactive 方式异步调用的代码实现,把响应 StreamObserver 对象作为入参传递到异步调用中,代码如下 (ClientCalls 类):

 private static <ReqT, RespT> void asyncUnaryRequestCall(
      ClientCall<ReqT, RespT> call, ReqT param, StreamObserver<RespT> responseObserver,
      boolean streamingResponse) {
    asyncUnaryRequestCall(call, param,
        new StreamObserverToCallListenerAdapter<ReqT, RespT>(call, responseObserver,
            new CallToStreamObserverAdapter<ReqT>(call),
            streamingResponse),
        streamingResponse);
  }

当收到响应消息时,调用 StreamObserver 的 onNext 方法,代码如下(StreamObserverToCallListenerAdapter 类):

public void onMessage(RespT message) {
      if (firstResponseReceived && !streamingResponse) {
        throw Status.INTERNAL
            .withDescription("More than one responses received for unary or client-streaming call")
            .asRuntimeException();
      }
      firstResponseReceived = true;
      observer.onNext(message);

当 Streaming 关闭时,调用 onCompleted 方法,如下所示(StreamObserverToCallListenerAdapter 类):

 public void onClose(Status status, Metadata trailers) {
      if (status.isOk()) {
        observer.onCompleted();
      } else {
        observer.onError(status.asRuntimeException(trailers));
      }
    }

通过源码分析可以发现,Reactive 风格的异步调用,相比于 Future 模式,没有任何同步阻塞点,无论是业务线程还是 gRPC 框架的线程都不会同步等待,相比于 Future 异步模式,Reactive 风格的调用异步化更彻底一些。

3.2 Streaming 模式服务调用

基于 HTTP/2.0,gRPC 提供了三种 streaming 模式:

  • 服务端 streaming
  • 客户端 streaming
  • 服务端和客户端双向 streaming

3.2.1 服务端 streaming

服务端 streaming 模式指客户端 1 个请求,服务端返回 N 个响应,每个响应可以单独的返回,它的原理如下所示:
gRPC 服务调用原理_第12张图片
适用的场景主要是客户端发送单个请求,但是服务端可能返回的是一个响应列表,服务端不想等到所有的响应列表都组装完成才返回应答给客户端,而是处理完成一个就返回一个响应,直到服务端关闭 stream,通知客户端响应全部发送完成。

在实际业务中,应用场景还是比较多的,最典型的如 SP 短信群发功能,如果不使用 streaming 模式,则原群发流程如下所示:
gRPC 服务调用原理_第13张图片
采用 gRPC 服务端 streaming 模式之后,流程优化如下:
gRPC 服务调用原理_第14张图片
实际上,不同用户之间的短信下发和通知是独立的,不需要互相等待,采用 streaming 模式之后,单个用户的体验会更好。

服务端 streaming 模式的本质就是如果响应是个列表,列表中的单个响应比较独立,有些耗时长,有些耗时短,为了防止快的等慢的,可以处理完一个就返回一个,不需要等所有的都处理完才统一返回响应。可以有效避免客户端要么在等待,要么需要批量处理响应,资源使用不均的问题,也可以压缩单个响应的时延,端到端提升用户的体验(时延敏感型业务)。

像请求 - 响应 - 异步通知类业务,也比较适合使用服务端 streaming 模式。它的 proto 文件定义如下所示:

 rpc ListFeatures(Rectangle) returns (stream Feature) {}

下面一起看下业务示例代码:
gRPC 服务调用原理_第15张图片
服务端 Sreaming 模式也支持同步阻塞和 Reactive 异步两种调用方式,以 Reactive 异步为例,它的代码实现如下(RouteGuideImplBase 类):

public void listFeatures(io.grpc.examples.routeguide.Rectangle request,
        io.grpc.stub.StreamObserver<io.grpc.examples.routeguide.Feature> responseObserver) {
      asyncUnimplementedUnaryCall(METHOD_LIST_FEATURES, responseObserver);
    }

构造 io.grpc.stub.StreamObserver responseObserver,实现它的三个回调接口,注意由于是服务端 streaming 模式,所以它的 onNext(Feature value) 将会被回调多次,每次都代表一个响应,如果所有的响应都返回,则会调用 onCompleted() 方法。

3.2.2 客户端 streaming

与服务端 streaming 类似,客户端发送多个请求,服务端返回一个响应,多用于汇聚和汇总计算场景,proto 文件定义如下:

rpc RecordRoute(stream Point) returns (RouteSummary) {}

业务调用代码示例如下(RouteGuideClient 类):

StreamObserver<Point> requestObserver = asyncStub.recordRoute(responseObserver);
    try {
      // Send numPoints points randomly selected from the features list.
      for (int i = 0; i < numPoints; ++i) {
        int index = random.nextInt(features.size());
        Point point = features.get(index).getLocation();
        info("Visiting point {0}, {1}", RouteGuideUtil.getLatitude(point),
            RouteGuideUtil.getLongitude(point));
        requestObserver.onNext(point);

异步服务调用获取请求 StreamObserver 对象,循环调用 requestObserver.onNext(point),异步发送请求消息到服务端,发送完成之后,调用 requestObserver.onCompleted(),通知服务端所有请求已经发送完成,可以接收服务端的响应了。

响应接收的代码如下所示:由于响应只有一个,所以 onNext 只会被调用一次(RouteGuideClient 类):

StreamObserver<RouteSummary> responseObserver = new StreamObserver<RouteSummary>() {
      @Override
      public void onNext(RouteSummary summary) {
        info("Finished trip with {0} points. Passed {1} features. "
            + "Travelled {2} meters. It took {3} seconds.", summary.getPointCount(),
            summary.getFeatureCount(), summary.getDistance(), summary.getElapsedTime());
        if (testHelper != null) {
          testHelper.onMessage(summary);
        }

异步服务调用时,将响应 StreamObserver 实例作为参数传入,代码如下:

StreamObserver<Point> requestObserver = asyncStub.recordRoute(responseObserver);

3.2.3 双向 streaming

客户端发送 N 个请求,服务端返回 N 个或者 M 个响应,利用该特性,可以充分利用 HTTP/2.0 的多路复用功能,在某个时刻,HTTP/2.0 链路上可以既有请求也有响应,实现了全双工通信(对比单行道和双向车道),示例如下:
gRPC 服务调用原理_第16张图片
proto 文件定义如下:

rpc RouteChat(stream RouteNote) returns (stream RouteNote) {}

业务代码示例如下(RouteGuideClient 类):

StreamObserver<RouteNote> requestObserver =
        asyncStub.routeChat(new StreamObserver<RouteNote>() {
          @Override
          public void onNext(RouteNote note) {
            info("Got message \"{0}\" at {1}, {2}", note.getMessage(), note.getLocation()
                .getLatitude(), note.getLocation().getLongitude());
            if (testHelper != null) {
              testHelper.onMessage(note);
            }
          }

构造 Streaming 响应对象 StreamObserver并实现 onNext 等接口,由于服务端也是 Streaming 模式,因此响应是多个的,也就是说 onNext 会被调用多次。

通过在循环中调用 requestObserver 的 onNext 方法,发送请求消息,代码如下所示(RouteGuideClient 类):

for (RouteNote request : requests) {
        info("Sending message \"{0}\" at {1}, {2}", request.getMessage(), request.getLocation()
            .getLatitude(), request.getLocation().getLongitude());
        requestObserver.onNext(request);
      }
    } catch (RuntimeException e) {
      // Cancel RPC
      requestObserver.onError(e);
      throw e;
    }
    // Mark the end of requests
    requestObserver.onCompleted();

requestObserver 的 onNext 方法实际调用了 ClientCall 的消息发送方法,代码如下(CallToStreamObserverAdapter 类):

private static class CallToStreamObserverAdapter<T> extends ClientCallStreamObserver<T> {
    private boolean frozen;
    private final ClientCall<T, ?> call;
    private Runnable onReadyHandler;
    private boolean autoFlowControlEnabled = true;
    public CallToStreamObserverAdapter(ClientCall<T, ?> call) {
      this.call = call;
    }
    private void freeze() {
      this.frozen = true;
    }
    @Override
    public void onNext(T value) {
      call.sendMessage(value);
    }

对于双向 Streaming 模式,只支持异步调用方式。

3.3 总结

gRPC 服务调用支持同步和异步方式,同时也支持普通的 RPC 和 streaming 模式,可以最大程度满足业务的需求。

对于 streaming 模式,可以充分利用 HTTP/2.0 协议的多路复用功能,实现在一条 HTTP 链路上并行双向传输数据,有效的解决了 HTTP/1.X 的数据单向传输问题,在大幅减少 HTTP 连接的情况下,充分利用单条链路的性能,可以媲美传统的 RPC 私有长连接协议:更少的链路、更高的性能:
gRPC 服务调用原理_第17张图片

gRPC 的网络 I/O 通信基于 Netty 构建,服务调用底层统一使用异步方式,同步调用是在异步的基础上做了上层封装。因此,gRPC 的异步化是比较彻底的,对于提升 I/O 密集型业务的吞吐量和可靠性有很大的帮助。

你可能感兴趣的:(GRPC,c++,后端)