JAVA_HOME
环境变量HADOOP_CONF_DIR
环境变量配置上修改Flink binary
目录的conf
子目录中的masters
和slaves
两个文件:
$cat conf/masters
master:8081
$cat conf/slaves
node1
node2
node3
修改conf/flink-conf.yaml
配置
jobmanager.rpc.address: master
然后把修改后的这三个文件同步到其他机器的相同conf
目录下.
然后启动flink集群:
./bin/start-cluster.sh
提交WordCount
作业
./bin/flink run examples/streaming/WordCount.jar
上传WordCount
的input
文件:
hdfs dfs -copyFromLocal story /test_dir/input_dir/story
提交读写hdfs的WordCount作业:
./bin/flink run examples/streaming/WordCount.jar --input hdfs:///test_dir/input_dir/story --output
hdfs:///test_dir/output_dir/output
增加WordCount作业的并发度(注意输出文件重名会提交失败):
./bin/flink run examples/streaming/WordCount.jar --input hdfs:///test_dir/input_dir/story --output
hdfs:///test_dir/output_dir/output --parallelism 20
JobManager是整个系统中最可能导致系统不可用的角色。一个TaskManager挂了,如果资源足够(空闲TaskSlot足够)的话,则只需要把相关task调度到其他空闲TaskSlot上,然后job从checkpoint中恢复即可。而如果当前集群中只配置了一个JobManager,则一旦JobManager挂了,就必须等待这个JobManager重新恢复,如果恢复时间过长,就可能导致整个job失败。
官方HA部署说明
flink-1.10
zookeeper
hadoop
flink
内部也提供了zookeeper
插件,通过修改/conf/zoo.cfg
文件即可,启动命令在/bin/start-zookeeper-quorum.sh
conf/flink-conf.yaml
# 高可用相关重要配置
# 配置high-availability mode
high-availability: zookeeper
high-availability.zookeeper.quorum: localhost:2181
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /cluster_one # important: customize per cluster /可以不配,自动生成
high-availability.storageDir: hdfs:///flink/recovery
state.checkpoints.dir: hdfs:///flink/checkpoints
state.savepoints.dir: hdfs:///flink/savepoints
conf/masters
和slaves
master1:8081
master2:8081
slave001
slave002
slave003
conf/zoo.cfg
server.1=slave001:2888:3888
server.2=slave002:2888:3888
server.3=slave003:2888:3888
修改完成后,再把这几个文件同步到不同机器到相同conf目录下。
$ bin/start-zookeeper-quorum.sh
HA-cluster
$ bin/start-cluster.sh
分别打开:
http://master1:8081
http://master2:8081
可以看到两个页面最后都转到了同一个地址上,这个地址就是当前主JobManager所在机器,另一个就是standby JobManager。
当我们知道主JobManager后,我们可以把主JobManager进程kill掉,比如当前主JobManager在matser1这个机器上,就把这个进程杀掉.
$ bin/stop-cluster.sh
$ bin/stop-zookeeper-quorum.sh
flink-1.10.0
与hadoop
集成vi /etc/profile
# 添加如下内容:
export HADOOP_CONF_DIR=/home/hadoop-2.6.5/etc/hadoop
# 使环境变量生效
source /etc/profile
jar
包放到/flink-1.10.0/lib
目录下.参考链接-Flink 1.10.0基于高可用部署
什么情况下适合使用yarn模式跑flink job?
相对于standalone模式,yarn模式允许flink job的好处有:
YARN Session
模式只会启动一个JobManager
,如果启动失败会重启../bin/yarn-session.sh
命令参数用法:
# 查看命令参数
./bin/yarn-session.sh -h
# 用法:
必选
-n,--container 分配多少个yarn容器 (=taskmanager的数量)
可选
-D 动态属性
-d,--detached 独立运行
-jm,--jobManagerMemory JobManager的内存 [in MB]
-nm,--name 在YARN上为一个自定义的应用设置一个名字
-q,--query 显示yarn中可用的资源 (内存, cpu核数)
-qu,--queue 指定YARN队列.
-s,--slots 每个TaskManager使用的slots数量
-tm,--taskManagerMemory 每个TaskManager的内存 [in MB]
-z,--zookeeperNamespace 针对HA模式在zookeeper上创建NameSpace
client必须要设置
HADOOP_HOME
,YARN_CONF_DIR
或者HADOOP_CONF_DIR
环境变量,通过这个环境变量来读取YARN
和HDFS
的配置信息,否则启动会失败。
创建一个YARN模式的flink集群:
./bin/yarn-session.sh -n 4 -jm 1024m -tm 4096m
提交一个flink job到flink集群:
./bin/flink run examples/streaming/WordCount.jar --input hdfs:///test_dir/input_dir/story --output hdfs:///test_dir/output_dir/output
这次提交
flink job
,虽然没有指定对应yarn application
的信息,确可以提交到对应的flink集群,原因在于/tmp/.yarn-properties-${user}
文件中保存了上一次创建yarn session的集群信息。所以如果同一用户在同一机器上再次创建一个yarn session
,则这个文件会被覆盖掉。
那如果删掉
/tmp/.yarn-properties-${user}
或者在另一个机器上提交作业能否提交到预期到yarn session
中呢?这也是可以的,如果配置了HighAvailability
,则可以根据cluster-id
,从zookeeper上获取到JobManager的地址和端口,从而提交作业。
high-availability.cluster-id
如果Yarn session没有配置HA,又该如何提交呢?这个时候就必须要在提交flink job的命令中指明YARN上的
application id
,通过“-yid”参数传入:
/bin/flink run -yid application_1548056325049_0048 examples/streaming/WordCount.jar --
input hdfs:///test_dir/input_dir/story --output hdfs:///test_dir/output_dir/output
我们可以发现,每次跑完任务不久,
TaskManager
就没有了,下次在提交任务的时候,TaskManager
又会重新拉起来。如果希望TaskManager
启动后就持续运行,可以在conf/flink-conf.yaml
文件中配置下面这个参数,单位是milliseconds
,默认值是30000L
,即30秒
:
resourcemanager.taskmanager-timeout
如果你只想运行单个flink job后就退出,那么可以用下面这个命令:
./bin/flink run -m yarn-cluster -yn 2 examples/streaming/WordCount.jar --input hdfs:///test_dir/input_dir/story --output hdfs:///test_dir/output_dir/output
常用的配置有:
./bin/flink run -h