u011414200

Hadoop-2.5.0-cdh5.3.2 HA 安装

一规划
- 1 软件版本
- 2 主机规划
- 3 变量名及目录路径规划
二环境准备
- 1 创建 hadoop 用户
- 2 网络配置
- 3 安装 JDK
- 4 配置 SSH 免密码通信
- 5 VNC 配置可选
三安装 ZooKeeper
四安装 Hadoop 重点
- 1 下载解压配置环境变量
- 2 修改配置文件
- 3 分发程序
五启动集群
- 1 启动ZooKeeper集群
- 2 格式化 ZooKeeper 集群目的是在 ZooKeeper 集群上建立 HA 的相应节点
- 3 启动JournalNode集群
- 4 格式化集群的 NameNode
- 5 启动刚格式化的 NameNode
- 6 同步 NameNode1 元数据到 NameNode2 上
- 7 启动 NameNode2
- 8 启动集群中所有的DataNode
- 9 在 RM1 启动 YARN
- 10 在 RM2 单独启动 YARN
- 11 启动 ZKFC
- 12 开启历史日志服务
- 13 总结
六运行 Hadoop自带 wordcount 程序
- 1 找到 Hadoop 自带的 examples 处
- 2 确保离开安全模式
- 3 在 HDFS 创建数据目录
- 4 上传本地文件到 HDFS
- 5 运行 WordCount 例子

一. 规划

集群中各机器的配置均相同：

CPU x3
内存 25G
硬盘 1.5T

1.1 软件版本

组件名	版本	下载地址
JDK	java version “1.8.0_60”	http://www.oracle.com/technetwork/java/javase/downloads/index.html
Hadoop	hadoop-2.5.0-cdh5.3.2.tar.gz	http://archive.cloudera.com/cdh5/cdh/5/
Zookeeper	zookeeper-3.4.5-cdh5.3.2.tar.gz	http://archive.cloudera.com/cdh5/cdh/5/

1.2 主机规划

IP	主机名	用户名	部署模块	进程
10.6.3.43	master5	hadoop5	NameNode ResourceManager	NameNode DFSZKFailoverController ResourceManager JobHistoryServer
10.6.3.33	master52	hadoop5	NameNode ResourceManager	NameNode DFSZKFailoverController ResourceManager JobHistoryServer
10.6.3.48	slave51	hadoop5	DataNode NodeManager Zookeeper	DataNode NodeManager JournalNode QuorumPeerMain
10.6.3.32	slave52	hadoop5	DataNode NodeManager Zookeeper	DataNode NodeManager JournalNode QuorumPeerMain
10.6.3.36	slave53	hadoop5	DataNode NodeManager Zookeeper	DataNode NodeManager JournalNode QuorumPeerMain

1.3 变量名及目录路径规划

目录名	路径
临时 tar.gz 安装包	/home/hadoop5/softwares/tar_packages
环境变量修改文件	/home/hadoop5/.bash_profile
集群所在目录	/usr/local/cluster
$JAVA_HOME	`/usr/local/jdk1.8.0_60`
$HADOOP_HOME	/usr/local/cluster/hadoop
$ZOOKEEPER_HOME	/usr/local/cluster/zookeeper

Note: 以上路径若不存在，则直接按照以下命令直接创建，并修改相关属性即可，其他类似

sudo mkdir -p /usr/local/cluster
sudo chown -R hadoop5:hadoop5 /usr/local/cluster/

二. 环境准备

2.1 创建 hadoop 用户

在集群中的每台机器都创建特定且相同的 Hadoop 用户账号可以区分 Hadoop 和本机上的其他服务，本教程创建的是 hadoop5 用户。
相关配置请参考《Centos6.5 创建新用户》

2.2 网络配置

要确保集群中的每台机器之间能够 ping 通
关闭防火墙和 SeLinux
集群中的所有机器的 /etc/hosts 文件内容均一致，都要将集群中的各 IP 和主机名对应起来

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
10.6.3.43       master5
10.6.3.33       master52
10.6.3.48       slave51
10.6.3.32       slave52
10.6.3.36       slave53

请参考《Centos6.5 网络配置》

2.3 安装 JDK

本教程安装的 java version “1.8.0_60” 的 jdk。相关配置请参考《 Centos6.5 JAVA配置》
安装 jdk 路径为 /usr/local/jdk1.8.0_60 。请参考《变量名及目录路径规划》

2.4 配置 SSH 免密码通信

相关配置请参考《Centos6.5下SSH免密码登陆配置》

2.5 VNC 配置（可选）

配置 VNC 是可选的，对搭建 hadoop 不是必需的，但因为提供了图形化操作界面，还是有必要安装下。相关教程请参考《 Centos6.5 VNC 配置》

三. 安装 ZooKeeper

按照主机规划中，仅在 slave51、slave52、slave53 的节点上安装搭建 ZooKeeper 的复制模式 (Replicated Mode)。
详细的安装步骤请参考：《 ZooKeeper 搭建》

ZooKeeper 的主进程 QuorumPeerMain 可以先不用启动，本文的最后，会梳理整个 HA 模式下启动的流程顺序。

四. 安装 Hadoop (重点)

4.1 下载，解压，配置环境变量

在 master5 的节点上，将从官网上下载的 hadoop tar 包解压至相应目录，详见《变量名及目录路径规划》

1. 创建相应目录

sudo mkdir -p /usr/local/cluster/hadoop
sudo chown -R hadoop5:hadoop5 /usr/local/cluster/

创建，并修改成功之后应该是如下这样，否则就是各种权限不足的问题了：

2. 解压 tar 包至指定目录

sudo tar -zxvf  ~/softwares/tar_packages/hadoop-2.5.0-cdh5.3.2.tar.gz -C /usr/local/cluster/hadoop --strip-components 1
sudo chown -R hadoop5:hadoop5 /usr/local/cluster/hadoop

3. 替换本地库文件
因为在 lib/native 路径下，没有任何文件，这个就涉及到编译源码的问题了。有兴趣详见：Hadoop-2.5.0-cdh5.3.2 获取源码及编译。

将编译之后的 lib/native 下的所有库文件都拷贝到解压后的 hadoop 包下的 lib/native 下。如下图

需要注意的是：最好保证编译时的机器环境与你搭建的集群环境是相同的，不容易出错。相关的 lib/native 包，笔者已上传 http://download.csdn.net/detail/u011414200/9201161

4. 配置环境变量

登陆到集群中每台机器上完成该配置：

vim ~/.bash_profile

添加如下：

export HADOOP_HOME=/usr/local/cluster/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_HOME/lib/native"
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

并执行以下命令，使环境变量生效

source ~/.bash_profile

4.2 修改配置文件

需要修改文件名：

文件名称	格式	描述
hadoop-env.sh	Bash 脚本	记录脚本中要用到的环境变量，以运行 Hadoop
core-site.xml	Hadoop 配置 XML	Hadoop Core 的配置项，例如 HDFS 和 MapReduce 常用的 I/O 设置等
hdfs-site.xml	Hadoop 配置 XML	Hadoop 守护进程的配置项，包括 namenode 和 datanode
mapred-site.xml	Hadoop 配置 XML	MapReduce 守护进程的配置项
yarn-site.xml	xml	Yarn 守护进程的配置项:资源管理器、作业历史服务器、Web 应用程序代理服务器和节点管理器
slaves	纯文本	运行 datanode 和 tasktracker 的机器列表（每行一个）

cd /usr/local/cluster/hadoop/etc/hadoop/

1. 修改 $HADOOP_HOME/etc/hadoop/hadoop-env.sh

vim hadoop-env.sh

其中修改的 JAVA_HOME 只要操作这一次，就能够保证整个集群使用同一版本的 Java。完整添加的代码如下

export JAVA_HOME=/usr/local/jdk1.8.0_60
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_HOME/lib/native"
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

添加 -Djava.library.path 到变量 HADOOP_OPTS 中，是为了让 HADOOP 能正确地指向本地库

2. 修改$HADOOP_HOME/etc/hadoop/hdfs-site.xml

vim hdfs-site.xml

在 <configuration> 与 </configuration> 之间添加如下内容

<property>
<name>dfs.nameservices</name>
<value>bigdata</value>
<description>the logical name for this new nameservice</description>
</property>

<property>
<name>dfs.ha.namenodes.bigdata</name>
<value>master5,master52</value>
<description>unique identifiers for each NameNode in the nameservice</description>
</property>



<!-- master5 RPC address -->
<property>
<name>dfs.namenode.rpc-address.bigdata.master5</name>
<value>master5:8020</value>
<description>the fully-qualified RPC address for NameNode master5 to listen on</description>
</property>
<!-- master5 http address -->
<property>
<name>dfs.namenode.http-address.bigdata.master5</name>
<value>master5:50070</value>
<description>the fully-qualified HTTP address for NameNode master5 to listen on</description>
</property>

<!-- master52 RPC address -->
<property>
<name>dfs.namenode.rpc-address.bigdata.master52</name>
<value>master52:8020</value>
<description>the fully-qualified RPC address for NameNode master52 to listen on</description>
</property>
<!-- master52 http address -->
<property>
<name>dfs.namenode.http-address.bigdata.master52</name>
<value>master52:50070</value>
<description>the fully-qualified HTTP address for NameNode master52 to listen on</description>
</property>



<!-- JournalNode Configuration -->
<property>
<name>dfs.journalnode.http-address</name>
<value>0.0.0.0:8480</value>
<description>listen port of JournalNode web UI </description>
</property>

<property>
<name>dfs.journalnode.rpc-address</name>
<value>0.0.0.0:8485</value>
</property>

<!-- NameNode data JournalNode postion -->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://slave51:8485;slave52:8485;slave53:8485/bigdata</value>
<description>the URI which identifies the group of JNs where the NameNodes will write/read edits </description>
</property>

<!-- JournalNode in disk postion -->
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/usr/local/cluster/data/journal</value>
<description> the path where the JournalNode daemon will store its local state </description>
</property>



<!-- on/off NameNode failed switch -->
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
<description>on/off NameNode failed switch</description>
</property>

<!-- switch ways -->
<property>
<name>dfs.client.failover.proxy.provider.bigdata</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
<description>the Java class that HDFS clients use to contact the Active NameNode</description>
</property>

<property>
<name>ha.zookeeper.session-timeout.ms</name>
<value>10000</value>
<description>指定ZooKeeper超时间隔，单位毫秒</description>
</property>

<!-- isolation mechanism-->
<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
<description>SSH to the Active NameNode and kill the process</description>
</property>

<!-- use sshfence isolation mechanism need ssh login -->
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/home/hadoop5/.ssh/id_rsa</value>
<description>use sshfence isolation mechanism need ssh login</description>
</property>

<!-- sshfence time -->
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
<description>sshfence time</description>
</property>


<!-- hdfs basic configuration -->
<property>
<name>dfs.replication</name>
<value>3</value>
</property>

<property>
<name>dfs.permissions</name>
<value>false</value>
<description>
If "true", enable permission checking in HDFS.
If "false", permission checking is turned off,
but all other behavior is unchanged.
Switching from one parameter value to the other does not change the mode,
owner or group of files or directories.
</description>
</property>

<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/cluster/data/namenode</value>
</property>

<property>
<name>dfs.namenode.edits.dir</name>
<value>file:/usr/local/cluster/data/namenode/edit_files</value>
<description>path to restore transaction file(edits) in namenode</description>
</property>

<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/cluster/data/datanode</value>
</property>


<property>
<name>dfs.datanode.max.xcievers</name>
<value>4096</value>
<description>max number of file which can be opened in a datanode</description>
</property>

<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>

参数过多就不一一介绍了，首先笔者给所搭建的集群自定义取名为 “bigdata”，然后设置了 master5 和 master52 两台机器的 rpc 及 http 的端口号。接着设置了关于 zookeeper 的属性，其中 slave51，slave52，slave53 上运行 zookeeper 和 journal 进程，并设置了相应存储的本地目录。下一步就是设置了基本属性，比如副本数为 3，namenode 和 datanode 的本地文件目录，namenode 上最大处理打开的文件数为 4096。更多详细信息，请查看《HDFS 详细配置》

3. 修改 $HADOOP_HOME/etc/hadoop/core-site.xml

vim core-site.xml

在 <configuration> 与 </configuration> 之间添加如下内容

<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/cluster/data/hadoop-${user.name}</value>
<description>A base for other temporary directories.</description>
</property>
<property>

<name>fs.defaultFS</name>
<value>hdfs://bigdata</value>
<description>the default path prefix used by the Hadoop FS client when none is given </description>
</property>

<property>
<name>ha.zookeeper.quorum</name>
<value>slave51:2181,slave52:2181,slave53:2181</value>
<description>this lists the host-port pairs running the ZooKeeper service</description>
</property>

hdfs://bigdata 中的 bigdta 即为你所搭建的 nameservice ID，这在 hdfs-site.xml 中自定义设置过
hadoop.tmp.dir 是 hadoop 文件系统依赖的基础配置，自定义输出路径
ha.zookeeper.quorum 中，添加 zookeeper 集群中所有主机 ip（或主机名）：client 连接 zookeeper 端口号（默认2181）

更多解释请参考《配置自动故障转移》

4. 修改 $HADOOP_HOME/etc/hadoop/yarn-site.xml

vim yarn-site.xml

在 <configuration> 与 </configuration> 之间添加如下内容

<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
<description>Enable RM HA</description>
</property>

<property>
<name>yarn.resourcemanager.ha.automatic-failover.enabled</name>
<value>true</value>
<description>Enable automatic failover; By default, it is enabled only when HA is enabled</description>
</property>

<!-- 使嵌入式自动故障转移。HA环境启动，与 ZKRMStateStore 配合处理fencing -->
<property>
<name>yarn.resourcemanager.ha.automatic-failover.embedded</name>
<value>true</value>
<description>Use embedded leader-elector to pick the Active RM, when automatic failover is enabled. By default, it is enabled only when HA is enabled</description>
</property>


<!-- RM cluster id -->
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>RM_HA_ID</value>
<description>Identifies the cluster. Used by the elector to ensure an RM doesn’t take over as Active for another cluster</description>
</property>

<!-- RM name -->
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
<description>List of logical IDs for the RMs. e.g., “rm1,rm2”</description>
</property>

<!-- RM address-->
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>master5</value>
<description>For each rm-id, specify the hostname the RM corresponds to. Alternately, one could set each of the RM’s service addresses</description>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>master52</value>
</property>


<property>
<name>yarn.resourcemanager.recovery.enabled</name>
<value>true</value>
</property>
<property>

<name>yarn.resourcemanager.store.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>

<!--zk address -->
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>slave51:2181,slave52:2181,slave53:2181</value>
<description>Address of the ZK-quorum. Used both for the state-store and embedded leader-election</description>
</property>

<!--故障处理类-->
<property>
<name>yarn.client.failover-proxy-provider</name>
<value>org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider</value>
<description>The class to be used by Clients, AMs and NMs to failover to the Active RM</description>
</property>


<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>20480</value>
<description>total memory (MB) which cen be used in computing in a datanode</description>
</property>

<property>
<name>yarn.nodemanager.resource.cpu-vcores</name>
<value>3</value>
<description>total cpu number which cen be used in computing in a datanode</description>
</property>

<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>

<property> 
<name>yarn.log.server.url</name> 
<value>http://master5:19888/jobhistory/logs/</value> 
</property> 

<!--当一台机器上运行大于1个的 RM 时，必须要在 namenode1 上单独配置rm1,在namenode2上单独配置rm2-->
<!--> <property> <name>yarn.resourcemanager.ha.id</name> <value>rm1</value> <description>Identifies the RM in the ensemble. If we want to launch more than one RM in single node, we need this configuration</description> </property> <-->

yarn.nodemanager.aux-services 设置为 mapreduce_shuffle 是因为 YARN 是一个通用目的服务，MapReduce 的 shuffle 句柄还需要显式地被启用
yarn.nodemanager.resource.cpu-vcores 设置
yarn.resourcemanager.ha.id 属性说明在同一个节点上，如果同时开启了不止一个的 RM，就必须在每个 RM 上 “单独”、”单独”、”单独” 地对这个属性进行配置。这跟我们一般喜欢把配置好的文件复制到其他机器上的习惯有点区别，切记！因为这个选项是可选的，换句话说，如果一个节点上只启动一个 RM ，就不用设置了，免得辣么麻烦了….

5. 修改mapred-site.xml
将 mapred-site.xml.template 复制 mapred-site.xml

cp  mapred-site.xml.template  mapred-site.xml
vim mapred-site.xml

在 <configuration> 与 </configuration> 之间添加如下内容

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.jobhistory.address</name>
<value>master5:10020</value>
</property>

<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master5:19888</value>
</property>

当 YARN 运行 MapReduce 时，mapred-site.xml 文件仍被用于记录通用的 MapReduce 属性
mapreduce.framework.name 属性必须要设置为 yarn ，这样客户端才会使用 YARN 而非其他

6. 修改 yarn-env.sh

vim yarn-env.sh

添加下图红框所标识处：

完整代码如下

if [ "x$JAVA_LIBRARY_PATH" != "x" ]; then
  YARN_OPTS="$YARN_OPTS -Djava.library.path=$JAVA_LIBRARY_PATH"
else
  YARN_OPTS="$YARN_OPTS -Djava.library.path=$HADOOP_HOME/lib:$HADOOP_HOME/lib/native"
fi

如果不加这个，当启动 YARN 时会报如下 WARN ，添加之后，WARN 消失

WARN org.apache.hadoop.util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable

修改方式2：

添加以下代码，如下图所示

JAVA_LIBRARY_PATH="$HADOOP_HOME/lib:$HADOOP_HOME/lib/native"

7. 修改 slaves

vim /usr/local/cluster/hadoop/etc/hadoop/slaves

把原来的 localhost 给删除了，随后添加所有 datanode 的主机名

slave51
slave52
slave53

4.3 分发程序

cd /usr/local/cluster
scp -r hadoop/ hadoop5@master52:/usr/local/cluster/
scp -r hadoop/ hadoop5@slave51:/usr/local/cluster/
scp -r hadoop/ hadoop5@slave52:/usr/local/cluster/
scp -r hadoop/ hadoop5@slave53:/usr/local/cluster/

五. 启动集群

注意：在启动之前务必将配置文件都检查清楚，包括环境变量设置且生效，最后要严格按照以下的步骤启动。

5.1 启动ZooKeeper集群

在集群中安装 ZooKeeper 的主机上启动 ZooKeeper 服务。在本教程中也就是在 slave51、slave52、slave53 的主机上启动相应进程。分别登陆到三台机子上执行：

zkServer.sh start

slave51、slave52、slave53 三台机子上启动了 Zookeeper 的主进程 QuorumPeerMain

5.2 格式化 ZooKeeper 集群，目的是在 ZooKeeper 集群上建立 HA 的相应节点

在任意的 namenode 上都可以执行，笔者还是选择了 master5 主机执行格式化命令，此操作仅仅表示和 zk 集群发生关联

hdfs zkfc -formatZK

Note：上述命令强烈建议读者自己手打，别复制。不然可能会报 Bad Argument -formatZK 的错误

随便挑一台 ZooKeeper 的主机进行验证，如直接在 slave51 上执行：

zkCli.sh
ls /
ls /hadoop-ha
ls /hadoop-ha/bigdata

出现如下即可（其中 bigdata 是你在 hdfs-site.xml 文件中设置的集群名称）：

5.3 启动JournalNode集群

分别在 slave51、slave52、slave53 上执行以下命令，因为这些机器之前已经在 hdfs-site.xml 的 dfs.namenode.shared.edits.dir 属性中设置过的

hadoop-daemon.sh start journalnode

这三台机器一定都要出现 JournalNode 进程，且在 /usr/local/cluster/data 本地磁盘路径下生成一个 journal 目录。

5.4 格式化集群的 NameNode

在 master5 的主机上执行以下命令，以格式化 namenode：

hdfs namenode -format

格式化 NameNode 会在磁盘 /usr/local/cluster/data/ 目录下会出现产生 namenode、edit_files 目录（该这两个路径在 hdfs-site.xml 中设置）

5.5 启动刚格式化的 NameNode

刚在 master5 上格式化了 namenode ，故就在 master5 上执行

hadoop-daemon.sh start namenode

出现如下 namenode 进程：

5.6 同步 NameNode1 元数据到 NameNode2 上

复制你 NameNode 上的元数据目录到另一个 NameNode，也就是此处的 master5 复制元数据到 master52 上。在 master52 上执行以下命令：

hdfs namenode -bootstrapStandby

在 master52 主机上的 /usr/local/cluster 下生成了 data 目录，且该 data 目录下的含有与 master5 相同的 namenode 目录，甚至里面的文件都一样（除了 in_use.lock 这个文件）

5.7 启动 NameNode2

master52 主机拷贝了元数据之后，就接着启动 namenode 进程了，执行

hadoop-daemon.sh start namenode

在 master52 上出现 namenode进程

5.8 启动集群中所有的DataNode

在 master5 上执行

hadoop-daemons.sh start datanode

在 master5 （master52进程也一样）上显示：

在各个 slave 的上的进程（以 slave51 为例）

各个 slave 主机上在 /usr/local/cluster/data/ 路径下生成 datanode 目录（路径在 hdfs-site.xml 设置）

5.9 在 RM1 启动 YARN

在 master5 的主机上执行以下命令：

start-yarn.sh

在 master5 的主机上查看进程多了 ResourceManager：

在 slave51、slave52、slave53 上查看到进程多了 NodeManager

5.10 在 RM2 单独启动 YARN

虽然上一步启动了 YARN ，但是在 master52 上是没有相应的 ResourceManager 进程，故需要在 master52 主机上单独启动：

yarn-daemon.sh start resourcemanager

在 master52 上多出了 ResourceManager 进程：

5.11 启动 ZKFC

在 master5 和 master52 的主机上分别执行如下命令：

hadoop-daemon.sh start zkfc

在 master5 和 master52 上都可以看到多出了 DFSZKFailoverController 进程

此时在两个浏览器上分别输入：

http://10.6.3.43:50070/dfshealth.html#tab-overview
http://10.6.3.33:50070/dfshealth.html#tab-overview

5.12 开启历史日志服务

只在 master5 的主机上执行

mr-jobhistory-daemon.sh   start historyserver

在 master5 上可以看到多出的 JobHistoryServer 进程

5.13 总结

安装完成后各节点上的进程，请点这里
关于Hadoop 启动过程详解，请点这里
关于启动常见问题与解答，请点这里
关于 HDFS 的 HA 手工/自动故障切换，请点这里
关于 YARN 的 HA 手工/自动故障切换，请点这里
HA 模式下的 Hadoop+ZooKeeper+HBase 启动顺序，请点这里

六. 运行 Hadoop自带 wordcount 程序

6.1 找到 Hadoop 自带的 examples 处

cd /usr/local/cluster/hadoop/share/hadoop/mapreduce
ls -al

就是图中的 hadoop-mapreduce-examples-2.5.0-cdh5.3.2.jar ，它所包含的测试用例包括

6.2 确保离开安全模式

查看当前 hdfs 是否处于安全模式

hdfs dfsadmin -safemode get

若都是 OFF ，则说明当前不处于安全模式，否则执行以下命令

hdfs dfsadmin -safemode leave

6.3 在 HDFS 创建数据目录

hadoop fs -mkdir -p /data/wordcount
hadoop fs -mkdir -p /output/

6.4 上传本地文件到 HDFS

hadoop fs -put /usr/local/cluster/hadoop/etc/hadoop/slaves /data/wordcount/
hadoop fs -ls /data/wordcount
hadoop fs -text /data/wordcount/slaves

将 slaves 文件上传到 HDFS 中，并能直接查看上传到 HDFS 中 slaves 文件的内容

6.5 运行 WordCount 例子

hadoop jar hadoop-mapreduce-examples-2.5.0-cdh5.3.2.jar wordcount /data/wordcount /output/wordcount

在成功执行之后，查看 HDFS 文件目录和最终的输出文件内容

hadoop fs -ls -R /
hadoop fs -text /output/wordcount/part-r-00000

能出现如下界面，那么恭喜你，安装成功！不谢~：

你可能感兴趣的:(Hadoop-2.5.0-cdh5.3.2 HA 安装)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
在Ubuntu中编译含有JSON的文件出现报错芝麻糊76 Linux kill_bug linux ubuntu json
在ubuntu中进行JSON相关学习的时候，我发现了一些小问题，决定与大家进行分享，减少踩坑时候出现不必要的时间耗费截取部分含有JSON部分的代码进行展示char*str="{\"title\":\"JSONExample\",\"author\":{\"name\":\"JohnDoe\",\"age\":35,\"isVerified\":true},\"tags\":[\"json\",\"
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

Hadoop-2.5.0-cdh5.3.2 HA 安装

一. 规划

1.1 软件版本

1.2 主机规划

1.3 变量名及目录路径规划

二. 环境准备

2.1 创建 hadoop 用户

2.2 网络配置

2.3 安装 JDK

2.4 配置 SSH 免密码通信

2.5 VNC 配置 （可选）

三. 安装 ZooKeeper

四. 安装 Hadoop (重点)

4.1 下载，解压，配置环境变量

4.2 修改配置文件

4.3 分发程序

五. 启动集群

5.1 启动ZooKeeper集群

5.2 格式化 ZooKeeper 集群，目的是在 ZooKeeper 集群上建立 HA 的相应节点

5.3 启动JournalNode集群

5.4 格式化集群的 NameNode

5.5 启动刚格式化的 NameNode

5.6 同步 NameNode1 元数据到 NameNode2 上

5.7 启动 NameNode2

5.8 启动集群中所有的DataNode

5.9 在 RM1 启动 YARN

5.10 在 RM2 单独启动 YARN

5.11 启动 ZKFC

5.12 开启历史日志服务

5.13 总结

六. 运行 Hadoop自带 wordcount 程序

6.1 找到 Hadoop 自带的 examples 处

6.2 确保离开安全模式

6.3 在 HDFS 创建数据目录

6.4 上传本地文件到 HDFS

6.5 运行 WordCount 例子

你可能感兴趣的:(Hadoop-2.5.0-cdh5.3.2 HA 安装)

2.5 VNC 配置（可选）