Java、大数据开发学习要点(持续更新中…)
Akka是用于开发并发、容错和可伸缩应用的框架(常用于RPC通信框架),是Actor模型的实现。每个Actor都是独立的,相互间通过发送异步消息进行通信(其强大之处就在于异步)。多个Actor构成一个ActorSystem,每个Actor顺序处理消息队列中的消息,ActorSystem中共享一个线程池(这也就是为什么不建议用同步调用的原因)。
ActorSystem能过识别消息发送给本地还是远程ActorSystem(路径)。Actor还有继承关系,父Actor可以创建子Actor(第一个Actor由ActorSystem创建),父Actor监督子Actor进行容错。
如上文所说,第一个Actor是ActorSystem创建的,另外,我们只能通过ActorRef(Actor的引用,对原生的Actor实例进行了封装,外界不能改变内部Actor状态)来于Actor进行通信。获取Actor需要通过其路径获得其ActorRef(显然远程通信需要在路径提供ip+端口号)。Actor的两种异步通信方法为tell和ack,tell是异步给某个Actor发送消息而不需要返回值;ack则是异步发送消息后,通过Future对象异步回调获取返回结果。
RemoteHandshakeMessage: 与 Actor 握手消息
HandshakeSuccessMessage: 与 Actor 握手成功消息
LocalFencedMessage: 本地 Fence Token 消息,在同一个JVM中的调用
RemoteFencedMessage: 远程 Fence Token 消息,包括本地不同JVM和跨节点JVM调用
ps:Fenced消息用来防止JobManager内组件在HA模式下的集群脑裂问题,思想fencing机制在选举时维护一个ID,过期ID无效化。
LocalRpcInvocation: 本地RpcEndpoint 调用消息,同一个JVM内的调用
RemoteRpcInvocation: 远程RpcEndpoint 调用消息,包括本地不同JVM和跨节点JVM调用
Flink 的 RPC 协议通过 RpcGateway 来定义,主要定义通信行为(用于远程调用 RpcEndpoint 的某些方法),可以理解为对方的客服端代理。远程调用远端的Actor,则必须提供ip和端口号,这点在RpcGateway接口中也能看到。
RpcEndpoint 是通信终端,提供 RPC 服务组件的生命周期管理(start、stop)。每个 RpcEndpoint 对应了一个路径(endpointId 和 actorSystem 共同确定),每个路径对应一个 Actor, 其实现了 RpcGateway 接口,其构造函数如下:
protected RpcEndpoint(final RpcService rpcService, final String endpointId) {
// 保存 rpcService 和 endpointId
this.rpcService = checkNotNull(rpcService, "rpcService");
this.endpointId = checkNotNull(endpointId, "endpointId");
// 通过 RpcService 启动 RpcServer
this.rpcServer = rpcService.startServer(this);
// 主线程执行器,所有调用在主线程中串行执行
this.mainThreadExecutor = new MainThreadExecutor(rpcServer,
this::validateRunsInMainThread); }
构造的时候调用 rpcService.startServer()启动 RpcServer,进入可以接收处理请求的状态, 最后将 RpcServer 绑定到主线程上真正执行起来。
值得注意的是在 Flink 的设计中,对于同一个 Endpoint,所有的调用都运行在主线程,因此不会有并发问题,当启动 RpcEndpoint进行 Rpc 调用时,其会委托 RcpServer 进行处理。
RpcService 和 RpcServer 是 RpcEndPoint 的成员变量。
(1) RpcService 是 Rpc 服务的接口,其主要作用如下:
在 Flink 中实现类为 AkkaRpcService,是 Akka 的 ActorSystem 的封装,基本可以理解成 ActorSystem 的一个适配器。在 ClusterEntrypoint(JobMaster)和 TaskManagerRunner (TaskExecutor)启动的过程中初始化并启动。
AkkaRpcService 中封装了 ActorSystem,并保存了 ActorRef 到 RpcEndpoint 的映射关系。 RpcService 跟 RpcGateway 类似,也提供了获取地址和端口的方法。
PpcService会根据 RpcEndpoint 类型(FencedRpcEndpoint 或其他)来创建不同的 AkkaRpcActor(FencedAkkaRpcActor 或 AkkaRpcActor),并将 RpcEndpoint 和 AkkaRpcActor 对应的 ActorRef 保存起来,AkkaRpcActor 是底层 Akka 调用的实际接收者,RPC 的请求在客户端被封装成 RpcInvocation 对象,以 Akka消息的形式发送。
(2) RpcServer 负责接收响应远端 RPC 消息请求,自身的代理对象。有两个实现:
RpcServer 的启动是通知底层的 AkkaRpcActor 切换为 START 状态,开始处理远程调用请求:
class AkkaInvocationHandler implements InvocationHandler, AkkaBasedEndpoint, RpcServer {
@Override
public void start() {
rpcEndpoint.tell(ControlMessages.START, ActorRef.noSender());
}
}
远程RPC请求最终使用动态代理将所有的消息转发到 InvocationHandler,具体代码如下:
public <C extends RpcEndpoint & RpcGateway> RpcServer startServer(C rpcEndpoint) {
... ...
// 生成 RpcServer 对象,
//而后对该server的调用都会进入Handler的invoke方法处理,Handler实现了多个接口的方法
// 生成一个包含这些接口的代理,将调用转发到 InvocationHandler
@SuppressWarnings("unchecked")
RpcServer server = (RpcServer) Proxy.newProxyInstance(
classLoader,
implementedRpcGateways.toArray(new Class<?> [implementedRpcGateways.size()]),
akkaInvocationHandler);
return server;
}
AkkaRpcActor 是 Akka 的具体实现,主要负责处理如下类型消息:
具体流程如下:
首先强调几点,第一,RpcService是在ClusterEntrypoint(JobMaster)、TaskManagerRunner(TaskExecutor)启动过程中就被初始化和启动了的;第二,在RpcEndpoint初始化时传入参数RpcService并由其启动RpcServer进而启动整个RpcEndpoint(实际是自己给自己发消息使得内部封装的Actor收到了START消息)。这个启动过程在上图中也有体现。
- 启动过程见强调的两点,主要就是RpcService是对ActorSystem的底层封装。RpcEndpoint封装了RpcService和RpcServer,提供Actor执行的单一线程。而RpcServer是Endpoint处理RPC请求的代理(代理的各种本地、远端消息请求),其代理实现类承接了消息解析和对底层Actor的消息通知的任务。
- 在组件的Endpoint启动后,发送RPC请求的Endpoint由RpcService向对端的RpcServer发送请求。对端RpcServer并不会直接处理请求消息而是返回一个Gateway(自身的一个客户端)。发送端通过此Gateway向对端RpcServer请求远程调用方法。
- 而Gateway中会有一个InvocationHandler(也就是对方的代理),其中的invoke()会对调用请求进行分析、对应的封装和处理。比如,首先判断是否为PRC方法调用,是则调用invokeRpc(),此方法将消息封装为RPCInvocation消息(本地就为LocalRPCInvocation,远程则为RemoteRpcInvocation);然后判断方法调用是否需要等待结果,如果无需等待(void)则向Actor发送tell类型的消息,如果需要返回结果则发送ack类型消息。
- 消息代理后正式通过RpcEndpoint绑定的ActorRef发送给AkkaRpcActor,内部封装的Actor根据不同消息类型进行相应的处理(第二节所提到的4种消息类型)。