到底什么是standalone模式

绝大多数博客都会说这个是单机模式。

谷歌上定义如下:

Standalone mode is the default mode of operation of Hadoop and it runs on a single node ( a node is your machine). HDFS and YARN doesn't run on standalone mode. Pseudo-Distributed mode stands between the standalone mode and fully distributed mode on a production level cluster. It is used to simulate the actual cluster.

 

包括hadoop以及flink,当你下载完安装包的时候,

会发现:

$HADOOP_HOME/etc/hadoop/slaves里面写着localhost

$FLINK_HOME/conf/slaves里面写着localhost.

没错,这个就是默认的standalone.

 

但是standalone是否就是单机模式呢?

严谨地讲,standalone指的是是单节点模式,并不是单机模式,这两者不是一个意思。

 

什么是节点?

有的人认为是一个大机房,有的人认为是一台电脑,有的人认为是一台虚拟云主机,也有的人认为是一台电脑中的多个节点。

不同技术资料有不同的上下文时,节点就会代表不同的意思。

 

standalone其实指的是当且仅当你的配置文件里面写着localhost的情况下,此时是单机模式。

standalone可否是集群模式?可以,但是必须进行高可用配置[1]中的"Deploy and Configure High Availability (HA) in Standalone Mode'。

#--------------------------------------------------------------------------------------------------------------------------------------------------

反过来,真实集群配置可否在单机中测试?

可以,做法也很简单,你的集群配置文件,数量改成两个,其余注释掉。

但是一台机子只有一个IP怎么办?

一个是127.0.0.1,另外一个是局域网IP(可能是有线局域网的IP,也可能是无线局域网的IP),修改你的hosts,这样就会被spark/hadoop认为是两个节点了,如此,你就可以测试真实集群的配置了。

#--------------------------------------------------------------------------------------------------------------------------------------------------

Reference:

[1]Apache Flink Fundamentals: Building a Development Environment and Configure, Deploy and Run Applications

 

你可能感兴趣的:(Flink)