Apache Flink 部署模式

        目录

 会话模式 Session Mode 

 单作业模式 Per-Job Mode (deprecated)

 应用模式 Application Mode


        在一些应用场景中,对于集群资源分配和占用的方式,可能会有特定的需求。Flink 为各种场景提供了不同的部署模式,主要有以下三种:

in Session Mode 会话模式

in a Per-Job Mode (deprecated)

单作业模式

in Application Mode

应用模式

Apache Flink 部署模式_第1张图片


会话模式 Session Mode 

        会话模式其实最符合常规思维。我们需要先启动一个集群,保持一个会话,在这个会话中通过客户端提交作业,集群启动时所有资源就都已经确定,所以所有提交的作业会竞争集群中的资源。

        会话模式比较适合于单个规模小、执行时间短的大量作业。

Apache Flink 部署模式_第2张图片


 单作业模式 Per-Job Mode (deprecated)

会话模式因为资源共享会导致很多问题,所以为了更好地隔离资源,我们可以考虑为每个提交的作业启动一个集群,这就是所谓的单作业(Per-Job)模式,Flink 本身无法直接这样运行,所以单作业模式一般需要借助一些资源管理平台来启动集群,比如 YARN、K8S。

Apache Flink 部署模式_第3张图片


 应用模式 Application Mode

        前面提到的两种模式下,应用代码都是在客户端上执行,然后由客户端提交给 JobManager的。但是这种方式客户端需要占用大量网络带宽,去下载依赖和把二进制数据发送给JobManager;加上很多情况下我们提交作业用的是同一个客户端,就会加重客户端所在节点的资源消耗。所以解决办法就是,我们不要客户端了,直接把应用提交到 JobManger 上运行。而这也就代表着,我们需要为每一个提交的应用单独启动一个 JobManager,也就是创建一个集群。这个 JobManager 只为执行这一个应用而存在,执行结束之后 JobManager 也就关闭了,这就是所谓的应用模式。

Apache Flink 部署模式_第4张图片

        应用模式与单作业模式,都是提交作业之后才创建集群;单作业模式是通过客户端来提交的,客户端解析出的每一个作业对应一个集群;而应用模式下,是直接由 JobManager 执行应用程序的,并且即使应用包含了多个作业,也只创建一个集群。

你可能感兴趣的:(Apache,Flink,flink,大数据)