薛定谔的猫不吃猫粮

hadoop3.1.4 完全分布式搭建HA（namenode resourcemanager高可用）保姆级教程-详细步骤-快速搭建-详解配置-历史服务器

一. 集群规划

ip	主机名	安装进程
192.168.204.14	hdp14	namenode,ZKFC,resourcemanager
192.168.204.15	hdp15	namenode,ZKFC,resourcemanager
192.168.204.16	hdp16	natanode,nodemanager,zookeeper,Journalnode
192.168.204.17	hdp17	natanode,nodemanager,zookeeper,Journalnode
192.168.204.18	hdp18	natanode,nodemanager,zookeeper,Journalnode

需要5台虚拟机,电脑配置20G以上。

二. 虚拟机环境配置

准备好一台虚拟机，4G内存，50G硬盘，配置好网络，连接Xshell工具

2.1 设置静态ip及主机名修改

root用户添加,修改ip的脚本ip.sh

[root@hdp14 ~]# cd /root/
[root@hdp14 ~]# mdkir bin
[root@hdp14 ~]# vim ip.sh
#添加下面的脚本内容
[root@hdp14 bin]# chmod +x ip.sh 
[root@hdp14 bin]# ls
ip.sh

脚本内容

#!/bin/bash   
file=/etc/sysconfig/network-scripts/ifcfg-ens33
hostnamectl --static set-hostname hdp14$1
echo "TYPE="Ethernet"" > $file
echo "BOOTPROTO="static"" >> $file
echo "NAME="ens33"" >> $file
echo "DEVICE="ens33"" >> $file
echo "ONBOOT="yes"" >> $file
echo ""IPADDR=192.168.204.$1"" >> $file
echo "PREFIX=24" >> $file
echo "GATEWAY=192.168.204.2" >> $file
echo "DNS1=192.168.204.2" >> $file
echo "DNS2=192.168.0.168" >> $file
#重启
reboot

执行修改语句

[root@hdp14 ~]# ip.sh 14
Invalid number of arguments.

Connection closed by foreign host.

Disconnected from remote host(hdp14149) at 18:24:40.

Type `help' to learn how to use Xshell prompt.
[c:\~]$

2.2 安装必要的环境

sudo yum install -y epel-release
sudo yum install -y psmisc nc net-tools rsync vim lrzsz ntp libzstd openssl-static tree iotop git

注：可使用Xshell工具，开多个窗口，将命令发送到所有会话，也可单台操作后期克隆,这里采用克隆虚拟机的方式

2.3 关闭防火墙和selinucx

关闭防火墙

[root@hdp14 ~]# systemctl stop firewalld
[root@hdp14 ~]# systemctl disable firewalld

关闭selinux

[root@hdp14 ~]# vi /etc/selinux/config
 把SELINUX=enforce  改成SELINUX=disabled

2.4 修改hosts文件

vim /etc/hosts
#添加如下内容
192.168.204.10 hdp10
192.168.204.11 hdp11
192.168.204.12 hdp12
192.168.204.13 hdp13
192.168.204.14 hdp14
192.168.204.15 hdp15
192.168.204.16 hdp16
192.168.204.17 hdp17
192.168.204.18 hdp18
192.168.204.19 hdp19

2.5 配置普通用户（along）具有root权限

修改sudoers文件，添加新用户

[root@hdp14 ~]# adduser along
[root@hdp14 ~]# passwd along

修改权限

[root@hdp14 ~]# sudo vim /etc/sudoers

放开这一行：%wheel ALL=(ALL) ALL ，并下面添加一行

along ALL=(ALL)       NOPASSWD:ALL

2.6 创建集群安装文件夹

创建/opt/bigdata和/opt/resource文件夹，并赋予along权限

[root@hdp14 ~]# sudo mkdir /opt/bigdata /opt/resource
[root@hdp14 ~]# sudo chown -R along:along /opt/bigdata /opt/resource

2.7 安装jdk1.8 配置环境变量

用along登陆，安装jdk

将jdk的tar包上传到集群的/opt/resource，并解压到/opt/bigdata

tar -zxf /opt/resource/jdk-8u212-linux-x64.tar.gz -C /opt/bigdata/

配置环境变量

sudo vim /etc/profile.d/my_env.sh

注意：这里环境变量不配置到/etc/profile文件中?

查看这个文件

[along@hdp14 hadoop-3.1.4]$ vim /etc/profile

靠前的地方有一段提示

# It's NOT a good idea to change this file unless you know what you
# are doing. It's much better to create a custom.sh shell script in
# /etc/profile.d/ to make custom changes to your environment, as this
# will prevent the need for merging in future updates.

文件末尾添加如下内容

#JAVA_HOME
export JAVA_HOME=/opt/bigdata/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin

克隆4台虚拟机【hdp15，hdp16，hdp17，hdp18】分别使用ip.sh 脚本修改主机名和ip地址

ip.sh 15
...

2.8 为along，root用户配置免密登陆

每台服务器的root 和along用户都需要配置，以hdp14的root为例

进入用户目录：

[root@hdp14 ~]# ssh-keygen -t ecdsa

连续三次回车，生成公钥和私钥

将公钥复制到目标服务器：

[root@hdp14 opt]# ssh-copy-id hdp14
/usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: "/root/.ssh/id_ecdsa.pub"
The authenticity of host 'hdp14 (192.168.204.14)' can't be established.
ECDSA key fingerprint is SHA256:cmFNNQajtQRotZPgk4ZmEFDJPChYRibK26PaCC81/pc.
ECDSA key fingerprint is MD5:d7:0b:cb:9c:0a:04:76:80:aa:37:f9:80:17:e8:4e:6b.
Are you sure you want to continue connecting (yes/no)? yes
/usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed
/usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keys
root@hdp14's password: 

Number of key(s) added: 1

Now try logging into the machine, with:   "ssh 'hdp14'"
and check to make sure that only the key(s) you wanted were added.

剩余4台，执行相同操作

ssh-copy-id hdp15
ssh-copy-id hdp16
ssh-copy-id hdp17
ssh-copy-id hdp18

重启，along用户登录，重复上面的操作。

2.9 编辑工具脚本

2.9.1 批量发送命令的脚本xcall

#!/bin/bash
hosts=(hdp14 hdp15 hdp16 hdp17 hdp18)
for host in ${hosts[@]}
do
    echo ===============  $host  ===============
    ssh $host "$*"
done

添加执行权限，测试脚本

2.9.2 文件分发脚本 axync

#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
  echo 请指定要分发的文件！
  exit;
fi

#2. 遍历集群所有机器
hosts=(hdp14 hdp15 hdp16 hdp17 hdp18)
for host in ${hosts[@]}
do
  echo ====================  $host  ====================
  #3. 遍历所有目录，挨个发送
  for file in $@
  do
    #4 判断文件是否存在
    if [ -e $file ]
    then
      #5. 获取父目录
      pdir=$(cd -P $(dirname $file); pwd)
      #6. 获取当前文件的名称
      fname=$(basename $file)
      ssh $host "mkdir -p $pdir"
      rsync -av $pdir/$fname $host:$pdir
    else
      echo $file 文件不存在！
    fi
  done
done

添加执行权限

[along@hdp14 bin]$ chmod +x axync

测试脚本

[along@hdp14 bin]$ axync axync

2.10 服务器之间集群同步

全部切换到root用户。

（0）查看所有节点ntpd服务状态和开机自启动状态

[along@hdp14 ~]$ sudo systemctl status ntpd

[along@hdp14 ~]$ sudo systemctl is-enabled ntpd

（1）在所有节点关闭ntp服务和自启动

[along@hdp14 ~]$ sudo systemctl stop ntpd

[along@hdp14 ~]$ sudo systemctl disable ntpd

（2）修改hdp14的ntp.conf配置文件

[along@hdp14 ~]$ sudo vim /etc/ntp.conf

修改内容如下

a）修改1（授权192.168.204.0-192.168.204.255网段上的所有机器可以从这台机器上查询和同步时间）

#restrict 192.168.1.0 mask 255.255.255.0 nomodify notrap

为

restrict 192.168.204.0 mask 255.255.255.0 nomodify notrap

b）修改2（集群在局域网中，不使用其他互联网上的时间）

server 0.centos.pool.ntp.org iburst
server 1.centos.pool.ntp.org iburst
server 2.centos.pool.ntp.org iburst
server 3.centos.pool.ntp.org iburst

为

#server 0.centos.pool.ntp.org iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
#server 3.centos.pool.ntp.org iburst

c）添加3（当该节点丢失网络连接，依然可以采用本地时间作为时间服务器为集群中的其他节点提供时间同步）

server 127.127.1.0
fudge 127.127.1.0 stratum 10

（3）修改hdp14的/etc/sysconfig/ntpd 文件

[along@hdp14 ~]$ sudo vim /etc/sysconfig/ntpd

增加内容如下（让硬件时间与系统时间一起同步）

SYNC_HWCLOCK=yes

（4）重新启动ntpd服务

[along@hdp14 ~]$ sudo systemctl start ntpd

（5）设置ntpd服务开机启动

[along@hdp14 ~]$ sudo systemctl enable ntpd

（6）在其他机器配置10分钟与时间服务器同步一次

[along@hdp15 ~]$ sudo crontab -e

编写定时任务如下：

*/10 * * * * /usr/sbin/ntpdate hdp14

（7）修改任意机器时间

[along@hdp15 ~]$ sudo date -s "2020-8-19 13:01:19"

（8）十分钟后查看机器是否与时间服务器同步

[along@hdp15 ~]$ sudo date

说明：测试的时候可以将10分钟调整为1分钟，节省时间。

2.10 安装zookeeper集群

下载zookeeper安装包 apache-zookeeper-3.5.9-bin.tar.gz

https://downloads.apache.org/zookeeper/zookeeper-3.5.9/

注意包名，不要下载错了

上传到hdp16的/opt/resource目录，解压到/opt/bigdata目录，修改文件夹名称

[along@hdp16 resource]$ tar -zxvf apache-zookeeper-3.5.9-bin.tar.gz -C /opt/bigdata/
[along@hdp16 resource]$ cd /opt/bigdata/
[along@hdp16 bigdata]$ mv apache-zookeeper-3.5.9/ zookeeper-3.5.9

创建zkData目录，配置服务器编号

[along@hdp16 bigdata]$ cd zookeeper-3.5.9/
[along@hdp16 zookeeper-3.5.9]$ mkdir zkData
[along@hdp16 zookeeper-3.5.9]$ cd zkData/
[along@hdp16 zkData]$ vim myid

新文件myid添加如下内容

修改配置文件

[along@hdp16 zkData]$ cd ../conf/
[along@hdp16 conf]$ ls
configuration.xsl  log4j.properties  zoo_sample.cfg
[along@hdp16 conf]$ mv zoo_sample.cfg zoo.cfg 
[along@hdp16 conf]$ vim zoo.cfg

数据存储路径修改为

dataDir=/opt/bigdata/zookeeper-3.5.9/zkData

在文件末尾添加

server.6=hdp16:2888:3888
server.7=hdp17:2888:3888
server.8=hdp18:2888:3888

同步/opt/bigdata/zookeeper-3.5.9 到hdp17，hdp18

[along@hdp16 bigdata]$ scp -r zookeeper-3.5.9/ along@hdp17:/opt/bigdata/
[along@hdp16 bigdata]$ scp -r zookeeper-3.5.9/ along@hdp18:/opt/bigdata/

在hdp17,hdp18上修改/opt/bigdata/zookeeper-3.5.9/zkData/myid中的6改为对应的id

[along@hdp17 zkData]$ vim /opt/bigdata/zookeeper-3.5.9/zkData/myid
7
[along@hdp18 zkData]$ vim /opt/bigdata/zookeeper-3.5.9/zkData/myid
8

进入zk所在目录，分别启动Zookeeper

[along@hdp16 zookeeper-3.5.9]$ bin/zkServer.sh start

[along@hdp17 zookeeper-3.5.9]$ bin/zkServer.sh start

[along@hdp18 zookeeper-3.5.9]$ bin/zkServer.sh start

最好使用集群启动脚本, zk.sh

[along@hdp14 bin]$ vim zk.sh

脚本内容

#!/bin/bash

hosts=(hdp16 hdp17 hdp18)
path=/opt/bigdata/zookeeper-3.5.9

case $1 in
"start"){
	for i in ${hosts[@]}
	do
        echo ---------- zookeeper $i 启动 ------------
		ssh $i "$path/bin/zkServer.sh start"
	done
};;
"stop"){
	for i in ${hosts[@]}
	do
        echo ---------- zookeeper $i 停止 ------------    
		ssh $i "$path/bin/zkServer.sh stop"
	done
};;
"status"){
	for i in ${hosts[@]}
	do
        echo ---------- zookeeper $i 状态 ------------    
		ssh $i "$path/bin/zkServer.sh status"
	done
};;
esac

增加执行权限

[along@hdp14 bin]$ sudo chmod +x zk.sh

三. hadoo安装配置

3.1 上传安装包并解压

将编译好的hadoop安装包上传到/opt/resource 文件夹，之前我在hdp16上编译
编译教程查看我的另一篇文章
https://blog.csdn.net/weixin_52918377/article/details/116456751

[root@hdp16 target]# scp hadoop-3.1.4.tar.gz along@hdp14:/opt/resource
along@hdp14's password: 
hadoop-3.1.4.tar.gz                                                                                                                                                    100%  287MB  17.8MB/s   00:16

解压到/opt/bigdata文件夹

[along@hdp14 resource]# tar -zxvf hadoop-3.1.4.tar.gz -C /opt/bigdata/

3.2 配置配置hadoop环境变量

查看hadoop安装的全路径

[along@hdp14 bigdata]$ cd hadoop-3.1.4/
[along@hdp14 hadoop-3.1.4]$ pwd
/opt/bigdata/hadoop-3.1.4

修改etc/profile.d/my_env.sh文件

[along@hdp11 hadoop-3.1.3]$ sudo vim /etc/profile.d/my_env.sh

文件末尾添加hadoop环境变量

#HADOOP_HOME
export HADOOP_HOME=/opt/bigdata/hadoop-3.1.4
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

分发环境变量

[along@hdp14 hadoop-3.1.4]$ sudo /home/along/bin/axync /etc/profile.d/my_env.sh

使环境变量生效，可使用Xshell，将命令发送到所有会话

[along@hdp14 ~]$ source /etc/profile.d/my_env.sh
[along@hdp15 ~]$ source /etc/profile.d/my_env.sh
[along@hdp16 ~]$ source /etc/profile.d/my_env.sh
...

3.3 集群配置

3.3.1 修改core-site.xml文件

[along@hdp14 hadoop-3.1.4]$ cd etc/hadoop/
[along@hdp14 hadoop]$ vim core-site.xml

文件内容

<configuration>
    <property>  
        <name>fs.defaultFSname>  
        <value>hdfs://nsvalue>  
    property> 
    
    <property>  
        <name>hadoop.tmp.dirname>  
        <value>/opt/bigdata/hadoop-3.1.4/data/tmpvalue>  
    property> 
    
    <property>  
        <name>hadoop.http.staticuser.username>  
        <value>alongvalue>  
    property> 
    
    <property>
        <name>hadoop.proxyuser.along.hostsname>
        <value>*value>
property>

    <property>
        <name>hadoop.proxyuser.along.groupsname>
        <value>*value>
property>

    <property>
        <name>hadoop.proxyuser.along.groupsname>
        <value>*value>
property>

    <property>  
        <name>ha.zookeeper.quorumname>  
        <value>hdp16:2181,hdp17:2181,hdp18:2181value>  
    property>
configuration>

3.3.2 修改hdfs-site.xml文件

[along@hdp14 hadoop]$ vim hdfs-site.xml

配置内容

<configuration>
    
 <property>  
      <name>dfs.replicationname>  
    <value>3value>  
 property> 
 <property>
   <name>dfs.nameservicesname>
   <value>nsvalue>
 property>
    

 <property>
   <name>dfs.ha.namenodes.nsname>
   <value>nn1,nn2value>
 property>

 <property>
   <name>dfs.namenode.rpc-address.ns.nn1name>
   <value>hdp14:8020value>
 property>

 <property>
   <name>dfs.namenode.http-address.ns.nn1name>
   <value>hdp14:50070value>
 property>

 <property>
   <name>dfs.namenode.rpc-address.ns.nn2name>
   <value>hdp15:8020value>
 property>

 <property>
   <name>dfs.namenode.http-address.ns.nn2name>
   <value>hdp15:50070value>
 property>

 
 <property>
   <name>dfs.namenode.shared.edits.dirname>
   <value>qjournal://hdp16:8485;hdp17:8485;hdp18:8485/nsvalue>
 property>

 <property>
   <name>dfs.journalnode.edits.dirname>
   <value>/opt/bigdata/hadoop-3.1.4/data/journalvalue>
 property>

 <property>
   <name>dfs.ha.automatic-failover.enabledname>
   <value>truevalue>
 property>

  
 <property>
   <name>dfs.client.failover.proxy.provider.nsname>
   <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvidervalue>
 property>

 
 <property>
   <name>dfs.ha.fencing.methodsname>
   <value>sshfencevalue>
 property>

 <property>
   <name>dfs.ha.fencing.ssh.private-key-filesname>
     
   <value>/home/along/.ssh//id_rsavalue>
 property>
configuration>

生产环境磁盘会有多个，可以配置多目录，这里我们是虚拟机。具体配置方式

<property>
        <name>dfs.datanode.data.dirname>
<value>file:///${hadoop.tmp.dir}/dfs/data1,file:///${hadoop.tmp.dir}/dfs/data2value>
property>

注意：每台服务器挂载的磁盘不一样，所以每个节点的多目录配置可以不一致。单独配置即可。

3.3.3 修改mapred-site.xml

[along@hdp14 hadoop]$ vim mapred-site.xml

文件内容

<configuration>

    <property>
        <name>mapreduce.framework.namename>
        <value>yarnvalue>
    property>
    
    <property>
        <name>mapreduce.jobhistory.addressname>
        <value>hdp14:10020value> 
    property>
    
    <property>
        <name>mapreduce.jobhistory.webapp.addressname>
        <value>hdp14:19888value> 
    property>
configuration>

3.3.4 修改yarn-site.xml文件

[along@hdp14 hadoop]$ vim yarn-site.xml

文件内容

<configuration>
    
    <property>  
        <name>yarn.nodemanager.aux-servicesname>  
        <value>mapreduce_shufflevalue>  
    property>
    
      
      
    <property>  
       <name>yarn.resourcemanager.ha.enabledname>  
       <value>truevalue>  
    property>  
      
    <property>  
       <name>yarn.resourcemanager.cluster-idname>  
       <value>rmclustervalue>  
    property>  
    <property>  
       <name>yarn.resourcemanager.ha.rm-idsname>  
       <value>rm1,rm2value>  
    property>  
    <property>  
       <name>yarn.resourcemanager.hostname.rm1name>  
       <value>hdp14value>  
    property>  
    <property>  
       <name>yarn.resourcemanager.hostname.rm2name>  
       <value>hdp15value>  
    property>  
 
       
    <property>  
       <name>yarn.resourcemanager.zk-addressname>  
        <value>hdp16:2181,hdp17:2181,hdp18:2181value>  
    property>  
       
    <property>  
       <name>yarn.resourcemanager.recovery.enabledname>  
       <value>truevalue>  
    property>  
   
       
    <property>  
       <name>yarn.resourcemanager.store.classname>  
     <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStorevalue> 
    property> 
    
	
    <property>
        <name>yarn.nodemanager.env-whitelistname>
  <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOMEvalue>
 property>
    
    
    <property>
        <name>yarn.log-aggregation-enablename>
        <value>truevalue>
    property>

    
    <property>  
        <name>yarn.log.server.urlname>  
        <value>http://hdp14:19888/jobhistory/logsvalue>
    property>

    
    <property>
        <name>yarn.log-aggregation.retain-secondsname>
        <value>604800value>
    property>

configuration>

3.3.5 修改workers

[along@hdp14 hadoop]$ vim workers

添加内容

hdp16
hdp17
hdp18

3.3.6 删除share/doc

[along@hdp14 hadoop-3.1.4]$ pwd
/opt/bigdata/hadoop-3.1.4
[along@hdp14 hadoop-3.1.4]$ ls
bin  etc  include  lib  libexec  LICENSE.txt  NOTICE.txt  README.txt  sbin  share
[along@hdp14 hadoop-3.1.4]$ rm -rf share/doc/*

3.3.7 分发hadoop-3.1.4文件夹到其他节点

axync hadoop-3.1.4/hadoop-3.1.4

3.3.8 配置ResourceManager节点

在主节点hdp14的yarn-site.xml上添加

<property>  
   <name>yarn.resourcemanager.ha.idname>  
   <value>rm1value>  
property>

hdp15的yarn-site.xml上添加

<property>  
   <name>yarn.resourcemanager.ha.idname>  
   <value>rm2value>  
proper3ty>

注意集群不同节点之间yarn-site.xml这个是不同的，不要覆盖了

3.4 启动初始化

3.4.1 启动zk

[along@hdp14 bin]$ zk.sh start
---------- zookeeper hdp16 启动 ------------
ZooKeeper JMX enabled by default
Using config: /opt/bigdata/zookeeper-3.5.9/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
---------- zookeeper hdp17 启动 ------------
ZooKeeper JMX enabled by default
Using config: /opt/bigdata/zookeeper-3.5.9/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
---------- zookeeper hdp18 启动 ------------
ZooKeeper JMX enabled by default
Using config: /opt/bigdata/zookeeper-3.5.9/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED

3.4.2 启动journalnode

[along@hdp16 hadoop-3.1.4]$ sbin/hadoop-daemon.sh start journalnode
[along@hdp17 hadoop-3.1.4]$ sbin/hadoop-daemon.sh start journalnode
[along@hdp18 hadoop-3.1.4]$ sbin/hadoop-daemon.sh start journalnode

查看进程

[along@hdp14 hadoop-3.1.4]$ xcall jps
=============== hdp14 ===============
8102 Jps
=============== hdp15 ===============
8321 Jps
=============== hdp16 ===============
7172 QuorumPeerMain
10649 Jps
9611 JournalNode
=============== hdp17 ===============
4197 QuorumPeerMain
5704 JournalNode
5964 Jps
=============== hdp18 ===============
4956 Jps
2878 QuorumPeerMain
4719 JournalNode

3.4.3 namenode格式化启动和同步

hdp14节点，格式化namenode

[along@hdp14 hadoop-3.1.4]$ bin/hdfs namenode -format
...
2021-05-07 18:01:13,394 INFO namenode.FSImage: Allocated new BlockPoolId: BP-1059449715-192.168.204.14-1620381673394
2021-05-07 18:01:13,426 INFO common.Storage: Storage directory /opt/bigdata/hadoop-3.1.4/data/dfs/name has been successfully formatted.
2021-05-07 18:01:14,232 INFO namenode.FSImageFormatProtobuf: Saving image file /opt/bigdata/hadoop-3.1.4/data/dfs/name/current/fsimage.ckpt_0000000000000000000 using no compression
2021-05-07 18:01:16,722 INFO namenode.FSImageFormatProtobuf: Image file /opt/bigdata/hadoop-3.1.4/data/dfs/name/current/fsimage.ckpt_0000000000000000000 of size 392 bytes saved in 2 seconds .
2021-05-07 18:01:16,749 INFO namenode.NNStorageRetentionManager: Going to retain 1 images with txid >= 0
2021-05-07 18:01:16,847 INFO namenode.FSImage: FSImageSaver clean checkpoint: txid = 0 when meet shutdown.
2021-05-07 18:01:16,848 INFO namenode.NameNode: SHUTDOWN_MSG: 
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at hdp14/192.168.204.14
************************************************************/

启动hdp14 namebode

[along@hdp14 hadoop-3.1.4]$ hdfs --daemon start namenode

hdp15上同步namenode

[along@hdp15 hadoop-3.1.4]$ bin/hdfs namenode -bootstrapStandby

成功之后启动这两台机器的namenode

[along@hdp15 hadoop-3.1.4]$ hdfs --daemon start namenode

访问web页面

http://hdp14:50070/dfshealth.html#tab-overview

http://hdp15:50070/dfshealth.html#tab-overview

可以看到2个name都是standby状态

#hdp14
Overview 'hdp14:8020' (standby)
Namespace:	ns
Namenode ID:	nn1
Started:	Fri May 07 18:05:06 +0800 2021
Version:	3.1.4, rUnknown
Compiled:	Thu May 06 15:47:00 +0800 2021 by root from Unknown
Cluster ID:	CID-6b98c6dd-187c-4d13-af42-9051eab4f691
Block Pool ID:	BP-1059449715-192.168.204.14-1620381673394

#hdp15
Overview 'hdp15:8020' (standby)
Namespace:	ns
Namenode ID:	nn2
Started:	Fri May 07 18:29:37 +0800 2021
Version:	3.1.4, rUnknown
Compiled:	Thu May 06 15:47:00 +0800 2021 by root from Unknown
Cluster ID:	CID-6b98c6dd-187c-4d13-af42-9051eab4f691
Block Pool ID:	BP-1059449715-192.168.204.14-1620381673394

先强制手动是其中一个节点变为active

[along@hdp14 hadoop-3.1.4]$ bin/hdfs haadmin -transitionToActive nn1 --forcemanual
You have specified the --forcemanual flag. This flag is dangerous, as it can induce a split-brain scenario that WILL CORRUPT your HDFS namespace, possibly irrecoverably.

It is recommended not to use this flag, but instead to shut down the cluster and disable automatic failover if you prefer to manually manage your HA state.

You may abort safely by answering 'n' or hitting ^C now.

Are you sure you want to continue? (Y or N) y
2021-05-07 18:44:00,417 WARN ha.HAAdmin: Proceeding with manual HA state management even though
automatic failover is enabled for NameNode at hdp15/192.168.204.15:8020
2021-05-07 18:44:00,909 WARN ha.HAAdmin: Proceeding with manual HA state management even though
automatic failover is enabled for NameNode at hdp14/192.168.204.14:8020

刷新web页面hdp14已变成active

Overview 'hdp14:8020' (active)

3.4.4 初始化zkfc和启动zkfc

hdp14上初始化

[along@hdp14 hadoop-3.1.4]$ hdfs zkfc -formatZK

hdp14启动zkfc

[along@hdp14 hadoop-3.1.4]$ sbin/hadoop-daemon.sh start zkfc 
WARNING: Use of this script to start HDFS daemons is deprecated.
WARNING: Attempting to execute replacement "hdfs --daemon start" instead.

hdp15上启动zkfc

[along@hdp15 hadoop-3.1.4]$ sbin/hadoop-daemon.sh start zkfc 
WARNING: Use of this script to start HDFS daemons is deprecated.
WARNING: Attempting to execute replacement "hdfs --daemon start" instead.

3.4.5 启动resourceManager

hdp14 启动 resourceManager

[along@hdp14 hadoop-3.1.4]$ yarn --daemon start resourcemanager

hdp15 启动 resourceManager

[along@hdp15 hadoop-3.1.4]$ yarn --daemon start resourcemanager

web页面查看一下

3.4.6 启动历史服务器

[along@hdp14 hadoop-3.1.4]$ mapred --daemon start historyserver

通过web页面查看一下

http://hdp14:19888/jobhistory

集群启动完成，看一下所有的进程

[along@hdp14 hadoop-3.1.4]$ xcall jps
=============== hdp14 ===============
20208 JobHistoryServer
22231 ResourceManager
22793 NameNode
21899 DFSZKFailoverController
22894 Jps
=============== hdp15 ===============
77299 NameNode
77412 DFSZKFailoverController
77700 Jps
77498 ResourceManager
=============== hdp16 ===============
117331 JournalNode
7172 QuorumPeerMain
119001 Jps
33225 ZooKeeperMain
117548 NodeManager
117167 DataNode
=============== hdp17 ===============
119792 JournalNode
4197 QuorumPeerMain
120711 Jps
119928 NodeManager
119647 DataNode
=============== hdp18 ===============
32215 JournalNode
33303 Jps
32392 NodeManager
32061 DataNode
2878 QuorumPeerMain

3.4.7 验证namenode高可用

在active namenode 节点，查看namenode的进程

[along@hdp14 hadoop-3.1.4]$ jps
15905 NameNode
16004 Jps
15494 ResourceManager
15166 DFSZKFailoverController

杀掉namenode进程

[along@hdp14 hadoop-3.1.4]$ kill -9 15905

刷新hdp14web页面，发现已经不能访问，刷新hdp15web页面，发现hdp15的namenode节点，已经从standby变成了active

Overview 'hdp15:8020' (active)

namenode高可用验证完成

3.4.8 验证yarn高可用

访问resourceManager地址

http://hdp15:8088

http://hdp14:8088

可以看到进入页面后两个地址都变成了

http://hdp14:8088/cluster

这个时候我们杀掉resourceManager所在的进程

[along@hdp14 hadoop-3.1.4]$ jps
16309 Jps
15494 ResourceManager
15166 DFSZKFailoverController
[along@hdp14 hadoop-3.1.4]$ kill -9 15494

刷新web页面，这个时候发现都进不去了，我们再打开

http://hdp15:8088

这个时候可以访问，yarn高可用验证成功

附录：
集群搭建的补充：必看

解决hadoop执行MapReduce程序时Ha和yarn的冲突问题
https://blog.csdn.net/weixin_52918377/article/details/116751791

解决hadoop高可用，使用start-dfs.sh脚本启动时,namenode启动不了的问题
https://blog.csdn.net/weixin_52918377/article/details/116756919

你可能感兴趣的:(hadoop,大数据组件,hadoop,大数据,hdfs,mapreduce,zookeeper)

珍藏！Java SpringBoot 精品源码合集约惠来袭，获取路径大公开秋野酱 java spring boot 开发语言
技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。文末获取源码联系文末获取源码联
基于Python+Django的可视化学习系统设计与实现（毕业设计源码+技术文档+系统部署）逐梦设计 Python毕业设计实战案例 python django 课程设计 vue.js 毕业设计源码
博主简介作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验，被多个学校常年聘为校外企业导师，指导学生毕业设计并参与学生毕业答辩指导，有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
数据权限访问控制（Apache Sentry） deepdata_cn 权限管理 apache sentry
ApacheSentry最初由Cloudera公司内部开发，针对Hadoop系统中的数据（主要是HDFS、Hive的数据）进行细粒度控制，对HDFS、Hive以及Impala有着良好的支持性。2013年Sentry成为Apache的孵化项目，为Hadoop集群元数据和数据存储提供集中、细粒度的访问控制。其架构包括DataEngine、Plugin、Policymetadata等部分，Plugin负
C++开发内存监控工具推荐点云SLAM 开发工具开发环境 c++开发语言 AddProperty gperftools Address 内存监控访问越界
在C++开发中，内存管理是至关重要的，尤其是当程序处理大数据或长时间运行时，内存泄漏或不当使用可能导致性能下降或崩溃。以下是几种常见且有效的内存监控工具，它们可以帮助开发者实时分析、诊断和优化程序的内存使用。1.ValgrindValgrind是一个广泛使用的内存调试和性能分析工具，它的Memcheck工具可以帮助你检查程序中的内存泄漏、内存越界、未初始化内存使用等问题。特点：检测内存泄漏。检查内
Java 大视界 -- Java 大数据在智慧农业精准灌溉与施肥决策中的应用（144）青云交大数据新视界 Java 大视界 java 大数据智慧农业精准灌溉施肥决策数据分析机器学习
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- 基于 Java 的大数据机器学习模型的多模态融合技术与应用（143）青云交大数据新视界 Java 大视界 java 大数据机器学习多模态融合智能安防智能客服数据处理
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
国内外的网络安全成难题，IPLOOK 2022年用产品筑起“护城墙” 爱浦路 IPLOOK 网络安全安全架构
《爱尔兰时报》和爱尔兰国家广播电台（RTE）于12月31日对2021年爱尔兰科技行业的赢家和弱点进行了年终盘点。双方纷纷表示，2021年爱尔兰科技行业最大的弱点是爱尔兰的网络安全，这一年是一场前所未有的灾难。随着人工智能、大数据、5G等新兴技术的发展，企业面临的威胁日益增加，信息安全的重要性变得越来越突显。现在我们把视线从爱尔兰的网络安全问题拉回到国内的网络安全现状。我国对网络安全问题保持时刻警惕
【Python系列】高效Parquet数据处理策略：合并与分析实践小团团0 python 开发语言
在大数据时代，数据的存储、处理和分析变得尤为重要。Parquet作为一种高效的列存储格式，被广泛应用于大数据处理框架中，如ApacheSpark、ApacheHive等。Parquet是一个开源的列存储格式，它被设计用于支持复杂的嵌套数据结构，同时提供高效的压缩和编码方案，以优化存储空间和查询性能。以下将详细介绍如何使用Python对Parquet文件进行数据处理与合并，并提供相应的源码示例。一、
hbase表无法删除，命令行卡住问题处理 spring208208 大数据组件线上问题分析 hbase 数据库大数据
问题现象hbase表无法删除，命令行卡住1.activemaster日志出现超时WARNorg.apache.hadoop.hbase.master.procedure.TruncateTableProcedure:Retriableerrortryingtotruncatetable=xxxstate=TRUNCATE_TABLE_PRE_OPERATIONorg.apache.hadoop.h
股神系列：蒋菲的量化投资中，如何利用大数据优化模型？她的数据来源有哪些？云策量化量化交易量化软件量化炒股量化炒股 QMT 量化交易入门教程 PTrade 股票投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》标题：股神系列：蒋菲的量化投资中，如何利用大数据优化模型？她的数据来源有哪些？正文：在金融投资的世界里，量化投资以其科学、系统和客观的特点，成为了众多投资者追求的“圣杯”。而在量化投资领域，蒋菲以其独特的大数据量化投资模型而闻名。本文将深入探讨蒋菲如何利用大数据优化其量化投资模型，以及她的数据来源有哪些。一、量化投资模型的优化
2024年第五届MathorCup数学应用挑战赛--大数据竞赛思路、代码更新中..... 宇哥预测优化代码学习 1024程序员节
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️研赛及概况一、竞赛背景与目的二、组织机构与参赛对象三、竞赛时间与流程四、竞赛要求与规则五、奖项设置与奖励六、研究文档撰写建议七、参考资料与资源1找程序网站推荐2公式编辑器、流程图、论文排版324年研赛资源下载4思路、Python、Matlab代码分享......⛳
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
Angular中`trackBy`函数的独特性与性能优化 t0_54program 编程问题解决手册 angular.js 前端 javascript 个人开发
在Angular项目中，优化性能是每一个开发者都需要考虑的问题。特别是在处理大数据量或动态变化的列表时，Angular的trackBy函数成为了我们手中的利器。然而，当我们面对多个列表使用相同trackBy函数时，可能会产生一些疑问：如果这些列表中的项有相同的ID，是否会影响Angular的变更检测？本文将详细探讨trackBy函数在这种情境下的表现及其带来的性能优化。trackBy函数简介tra
石油储运生产 2D 可视化，组态应用赋能工业智慧发展智慧园区智慧城市 big data 人工智能大数据物联网网络
当前，国际油价低位徘徊导致各国石油化工行业投资大幅缩减，石油化工建设行业竞争环境日趋严峻，施工企业的利润空间也被不断压缩。内外交困的环境下，促使企业采取更有效的管理手段来提高效率和降低成本。石油工业大数据具有无限潜力与价值，将大数据与数据挖掘技术应用其中，不仅可以提升石油行业工业化水平，而且对其智慧化发展起到强有力的推动作用。图扑软件-构建先进2D和3D可视化所需要的一切图扑软件采用自主研发的HT
人民日报报道，华为云赋能智能制造助力图扑软件构造数字孪生场景智慧园区华为人工智能物联网
2021年12月22日，《人民日报》头版头条刊登了《华为云赋能智能制造，助力图扑软件构造数字孪生场景》一文，聚焦数据可视化建设发展。报道指出，数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神;高效便捷管控的背后，是云端平台各大企业的互助共赢;高质精准2D、3D数据可视图的背后，是专注于数据可视化Web组态开发的厦门图扑软件科技有限公司。并对厦门图扑软件科技有限公司进
华为云赋能智能制造，助力图扑软件构造数字孪生场景 36Kr网科技华为云制造 big data
出行手机查看交通方案、物业管理的智能可视勘察管控、疫情地图提前预知危害……这些曾经存在于科幻片中的高科技场景一一在现代生活得到了应用与普及，其背后的数据可视化应用，正贯穿于当今大数据时代的各行各业，成为人们洞察数据内涵的有力工具，推动数字经济发展驶入“快车道”。数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神；高效便捷管控的背后，是云端平台各大企业的互助共赢；高质精
【Spark】查询优化中分区（Partitioning）和分桶（Bucketing）是什么关系？什么时候应当分区，什么时候应当分桶？ petrel2015 spark 大数据分布式数据库
在学习Spark的过程中，分区和分桶乍一看很像，都能为了计算加速，但是仔细一想，一查还是有些差异的，甚至说差异很大。那么具体有什么差异点，有什么相同点。我做出了如下的整理，供大家参考，欢迎指正。相同点分区（Partitioning）和分桶（Bucketing）在很多方面具有相似性，它们都是用于优化大数据查询性能的技术数据划分的目的：优化查询性能分区和分桶的核心目标是通过将数据分割成更小的逻辑单元来
如何设计一个 RPC 框架？需要考虑哪些点？蒂法就是我 rpc 网络协议网络
设计一个完整的RPC框架需要覆盖以下核心模块及关键技术点：一、核心架构模块模块功能与实现要点服务注册与发现使用Zookeeper/Nacos等实现服务地址动态注册与订阅，支持心跳检测和节点变更通知网络通信层基于Netty或gRPC的HTTP/2实现异步非阻塞传输，优化连接池复用与零拷贝技术序列化协议支持Protobuf（高性能）、JSON（可读性）、Hessian（跨语言）等，需平衡性能与扩展性动
【Linux 下的 bash 无法正常解析, Windows 的 CRLF 换行符问题导致的】待磨的钝刨 linux bash windows
文章目录报错原因：解决办法：方法一：用`dos2unix`修复方法二：手动转换换行符方法三：VSCode或其他编辑器手动改总结这个错误很常见，原因是你的wait_for_gpu.sh脚本文件格式不对，具体来说是Windows的CRLF换行符问题导致的，Linux下的bash无法正常解析。hadoop@hadoop:~/anaconda3$bashwait_for_gpu.sh:invalidopt
大数据技术实战---项目中遇到的问题及项目经验一个“不专业”的阿凡大数据
问题导读：1、项目中遇到过哪些问题？2、Kafka消息数据积压，Kafka消费能力不足怎么处理？3、Sqoop数据导出一致性问题？4、整体项目框架如何设计？项目中遇到过哪些问题7.1Hadoop宕机（1）如果MR造成系统宕机。此时要控制Yarn同时运行的任务数，和每个任务申请的最大内存。调整参数：yarn.scheduler.maximum-allocation-mb（单个任务可申请的最多物理内存
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
【Hive】-- hive 3.1.3 伪分布式部署（单节点） oo寻梦in记 Apache Paimon 大数据服务部署 hive 分布式 hadoop
1、环境准备1.1、版本选择apachehive3.1.3apachehadoop3.1.0oraclejdk1.8mysql8.0.15操作系统：Macos10.151.2、软件下载https://archive.apache.org/dist/hive/https://archive.apache.org/dist/hadoop/1.3、解压tar-zxvfapache-hive-4.0.0-
Java后端开发技术详解小二爱编程· java 开发语言
Java作为一门成熟的编程语言，已广泛应用于后端开发领域。其强大的生态系统和广泛的支持库使得Java成为许多企业和开发者的首选后端开发语言。随着云计算、微服务架构和大数据技术的兴起，Java后端开发的技术栈也不断演进。本文将详细介绍Java后端开发的核心技术，包括Java基础、常见框架、数据库操作、缓存技术、异步编程等。1.Java基础：理解面向对象的编程Java是一种面向对象的编程语言，面向对象
【Linux】Hadoop-3.4.1的伪分布式集群的初步配置孤独打铁匠Julian Linux linux hadoop ubuntu
配置步骤一、检查环境JDK#目前还是JDK8最适合Hadoopjava-versionecho$JAVA_HOMEHadoophadoopversionecho$HADOOP_HOME二、配置SSH免密登录Hadoop需要通过SSH管理节点（即使在伪分布式模式下）sudoaptinstallopenssh-server#安装SSH服务（如未安装）cd~/.ssh/ssh-keygen-trsa#生
IDC权威认证！永洪科技入选 IDC「GBI图谱」，点亮生成式 BI 价值灯塔永洪科技科技人工智能 BI 大数据数据分析
大数据市场正在稳步前进，生成式AI已成为厂商服务的重点方向，其发展离不开数据底座建设和数据工程管理，反过来AI也会帮助开发运维人员、业务人员和管理层更好地使用、查询数据。IDC调研数据显示，在生成式AI的驱动下，未来5年企业在数据管理和数据分析基础设施建设的投资增长率将分别达到8.7%和9.2%。近日，国际咨询机构IDC发布了《中国数据智能市场生态图谱V5.0》，在这一领域，永洪科技以其创新前沿的
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
读书笔记五 ---大数据之路--数仓分层 qq_38215991 big data 大数据
数据分层在流式数据模型中,数据模型整体上分为五层。ODS层跟离线系统的定义一样,ODS层属于操作数据层,是直接从业务系统采集过来的最原始数据（进行了数据清洗）,包含了所有业务的变更过程,数据粒度也是最细的。在这一层,实时和离线在源头上是统一的,这样的好处是用同一份数据加工出来的指标,口径基本是统一的,可以更方便进行实时和离线问数据比对。例如:原始的订单变更记录数据、服务器引擎的访同日志。（原始数据
使用LangGraph迁移MapReduceDocumentsChain进行长文档的摘要 dgay_hua python
在大数据处理和文本分析领域，MapReduce是一种非常重要的策略，用于处理和分析大型数据集。具体到文本处理方面，MapReduceDocumentsChain구현了一种map-reduce策略，可以有效地处理长文本。本文将介绍如何从MapReduceDocumentsChain迁移到LangGraph，并探讨LangGraph在流处理、检查点恢复等方面的优势。技术背景介绍MapReduceDoc
Python用Bokeh处理大规模数据可视化的最佳实践一键难忘 Bokeh python 开发语言
用Bokeh处理大规模数据可视化的最佳实践在大规模数据处理和分析中，数据可视化是一个至关重要的环节。Bokeh是一个在Python生态中广泛使用的交互式数据可视化库，它具有强大的可扩展性和灵活性。本文将介绍如何使用Bokeh处理大规模数据可视化，并提供一些最佳实践和代码实例，帮助你高效地展示大数据集中的重要信息。1.为什么选择Bokeh？Bokeh是一个专为浏览器呈现而设计的可视化库，它支持高效渲
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

hadoop3.1.4 完全分布式搭建HA（namenode resourcemanager高可用）保姆级教程-详细步骤-快速搭建-详解配置-历史服务器

一. 集群规划

二. 虚拟机环境配置

2.1 设置静态ip及主机名修改

2.2 安装必要的环境

2.3 关闭防火墙和selinucx

2.4 修改hosts文件

2.5 配置普通用户（along）具有root权限

2.6 创建集群安装文件夹

2.7 安装jdk1.8 配置环境变量

2.8 为along，root用户配置免密登陆

2.9 编辑工具脚本

2.9.1 批量发送命令的脚本xcall

2.9.2 文件分发脚本 axync

2.10 服务器之间集群同步

2.10 安装zookeeper集群

三. hadoo安装配置

3.1 上传安装包并解压

3.2 配置配置hadoop环境变量

3.3 集群配置

3.3.1 修改core-site.xml文件

3.3.2 修改hdfs-site.xml文件

3.3.3 修改mapred-site.xml

3.3.4 修改yarn-site.xml文件

3.3.5 修改workers

3.3.6 删除share/doc

3.3.7 分发hadoop-3.1.4文件夹到其他节点

3.3.8 配置ResourceManager节点

3.4 启动初始化

3.4.1 启动zk

3.4.2 启动journalnode

3.4.3 namenode格式化 启动和同步

3.4.4 初始化zkfc和启动zkfc

3.4.5 启动resourceManager

3.4.6 启动历史服务器

3.4.7 验证namenode高可用

3.4.8 验证yarn高可用

你可能感兴趣的:(hadoop,大数据组件,hadoop,大数据,hdfs,mapreduce,zookeeper)

3.4.3 namenode格式化启动和同步