心在梦想

基于原生态hadoop2.7.9 HA集群搭建

1. 条件准备

软件准备：

Centos 7.2 64位操作系统,jdk1.8 64位, hadoop2.7.9,zookeeper 3.4.9,Hive 2.2

硬件条件：(Vmware虚拟机)

1台主节点机器, 配置cpu 1个内存2g 硬盘50G

2台从节点机器,其中一台内存为2G，其他配置一样

各个节点IP如下：

服务器名字	Ip地址	备注（为方便操作将hostname改为如下）
hadoop001	192.168.0.211	hadoop001
hadoop002	192.168.0.212	hadoop002
hadoop003	192.168.0.213	hadoop003

搭建预期结构

hostname	软件	进程
hadoop001	JDK,hadoop	Namenode, ZKFC , resourcemanager
hadoop002	JDK,hadoop	Zookeer, datanode, journalnode, quorumpeermain, nodemanager
hadoop003	JDK,hadoop	Zookeer, datanode, journalnode, quorumpeermain, nodemanager

2. 服务器准备

安装前需要安装好vmvare虚拟机，搭建好Linux服务器集群，新建用户hadoop，以下操作非必要都在hadoop用户下操作

2.1 关闭服务器防火墙

Centos7 默认用的是firewall作为防火墙，因此需要关闭，因此执行以下红色字体

查看已经开放的端口：firewall-cmd--list-ports

开启端口：firewall-cmd --zone=public--add-port=80/tcp --permanent

命令含义：

–zone #作用域

–add-port=80/tcp #添加端口，格式为：端口/通讯协议

–permanent #永久生效，没有此参数重启后失效

重启firewall：firewall-cmd --reload

停止firewall：systemctl stop firewalld.service

禁止firewall开机启动：systemctl disable firewalld.service

查看默认防火墙状态（关闭后显示notrunning，开启后显示running）：firewall-cmd –state

2.2 修改主机名

通过xshell，远程登录主机192.168.0.211，登录成功后,然后执行命令：

vim /etc/hostname 编辑主机名字为:hadoop001(这个需要重启服务器才能生效)，退出保存

接着执行命令：hostname hadoop001

修改完成211服务器主机名，分别以上方式修改另外服务器主机名。

2.3 修改主机hosts

登录到hadoop001服务器，执行以下命令：

vim /etc/hosts 进入文件编辑，加入以下内容：

192.168.0.211 hadoop001

192.168.0.212 hadoop002

192.168.0.213 hadoop003

然后保存退出。然后继续执行命令：

分别执行命令远程拷贝hosts文件到各个节点，覆盖掉本身的hosts文件。

scp –r /etc/hosts [email protected]：/etc/

注意：1.如果ssh命令不能用，可能机器本身没有ssh，需要安装：yum install sshpass.x86_64

2.确保各个节点能相互ping通，如果ping不通，查看下防火墙是否关闭。

2.4 ssh免密登录设置

登录到hadoop001服务器hadoop用户下执行命令:

ssh-keygen –t rsa

进入目录/home/hadoop/.ssh/,发现多了三文件：authorized_keys,id_rsa,id_rsa.pub

执行命令： cp ~/.ssh/id_rsa.pub ~/.ssh.authorized_keys

验证执行：ssh localhost，查看本节点是否可以无密码登录。

将授权文件拷贝到其他节点,执行命令：

scp authorized_keyshadoop@hadoop002:~/.ssh/

scp id_rsahadoop@hadoop002:~/.ssh/

scp id_rsa.pubhadoop@hadoop002:~/.ssh/

同样其他节点也执行这样的操作。执行完毕后，测试一下。节点之间能否相互之间无密码登录。

2.5 ntp时间同步配置

（1）首先安装ntp服务

在linux的root用户下执行以下命令安装ntp服务

yuminstall ntp –y

(2) 修改ntp配置文件（server）

我们需要在linux集群中找到一台作为ntp服务器的server，其他机器则为ntp的client，因此，在server服务器上修改一下配置文件

执行 vim/etc/ntp.conf

# /etc/ntp.conf, configuration for ntpd; see ntp.conf(5) for help

driftfile /var/lib/ntp/ntp.drift

# Enable this if you want statistics to be logged.

#statsdir /var/log/ntpstats/

statistics loopstats peerstats clockstats

filegen loopstats file loopstats type day enable

filegen peerstats file peerstats type day enable

filegen clockstats file clockstats type day enable

# Specify one or more NTP servers.

# Use servers from the NTP Pool Project. Approved by Ubuntu Technical Board

# on 2011-02-08 (LP: #104525). See http://www.pool.ntp.org/join.html for

# more information.

#linux自带的时间同步，需要注释掉

#pool 0.ubuntu.pool.ntp.org iburst

#pool 1.ubuntu.pool.ntp.org iburst

#pool 2.ubuntu.pool.ntp.org iburst

#pool 3.ubuntu.pool.ntp.org iburst

# Use Ubuntu's ntp server as a fallback.

#pool ntp.ubuntu.com

# Access control configuration; see /usr/share/doc/ntp-doc/html/accopt.html for

# details. The web page

# might also be helpful.

# Note that "restrict" applies to both servers and clients, so a configuration

# that might be intended to block requests from certain clients could also end

# up blocking replies from your own upstream servers.

# By default, exchange time with everybody, but don't allow configuration.

restrict -4 default kod notrap nomodify nopeer noquery limited

restrict -6 default kod notrap nomodify nopeer noquery limited

# Local users may interrogate the ntp server more closely.

restrict 127.0.0.1

restrict ::1

#因为是内网，所以用本地时间做为服务器时间，注意这里不是127.0.0.1

server 127.127.1.0

fudge 127.127.1.0 stratum 8

#开放192.168.0.0 整个网段，即在这个网段的所有机器都可以使用 214 作为时间同步服务端

restrict 192.168.0.0 mask 255.255.255.0 nomodify notrap

# Needed for adding pool entries

restrict source notrap nomodify noquery

# Clients from this (example!) subnet have unlimited access, but only if

# cryptographically authenticated.

#restrict 192.168.123.0 mask 255.255.255.0 notrust

# If you want to provide time to your local subnet, change the next line.

# (Again, the address is an example only.)

#broadcast 192.168.123.255

# If you want to listen to time broadcasts on your local subnet, de-comment the

# next lines. Please do this only if you trust everybody on the network!

#disable auth

#broadcastclient

#Changes recquired to use pps synchonisation as explained in documentation:

#http://www.ntp.org/ntpfaq/NTP-s-config-adv.htm#AEN3918

#server 127.127.8.1 mode 135 prefer # Meinberg GPS167 with PPS

#fudge 127.127.8.1 time1 0.0042 # relative to PPS for my hardware

#server 127.127.22.1 # ATOM(PPS)

#fudge 127.127.22.1 flag3 1 # enable PPS API

设置完成退出保存，然后重启ntp服务

执行 service ntp restart

(3) 修改ntp配置文件（client）

同样的server端已经配置好了，client的配置相对简单

执行 vim /etc/ntp.conf

# /etc/ntp.conf, configuration for ntpd; see ntp.conf(5) for help

driftfile /var/lib/ntp/ntp.drift

# Enable this if you want statistics to be logged.

#statsdir /var/log/ntpstats/

statistics loopstats peerstats clockstats

filegen loopstats file loopstats type day enable

filegen peerstats file peerstats type day enable

filegen clockstats file clockstats type day enable

# Specify one or more NTP servers.

# Use servers from the NTP Pool Project. Approved by Ubuntu Technical Board

# on 2011-02-08 (LP: #104525). See http://www.pool.ntp.org/join.html for

# more information.

#linux自带的时间同步，需要注释掉

#pool 0.ubuntu.pool.ntp.org iburst

#pool 1.ubuntu.pool.ntp.org iburst

#pool 2.ubuntu.pool.ntp.org iburst

#pool 3.ubuntu.pool.ntp.org iburst

# Use Ubuntu's ntp server as a fallback.

#pool ntp.ubuntu.com

# Access control configuration; see /usr/share/doc/ntp-doc/html/accopt.html for

# details. The web page

# might also be helpful.

# Note that "restrict" applies to both servers and clients, so a configuration

# that might be intended to block requests from certain clients could also end

# up blocking replies from your own upstream servers.

# By default, exchange time with everybody, but don't allow configuration.

restrict -4 default kod notrap nomodify nopeer noquery limited

restrict -6 default kod notrap nomodify nopeer noquery limited

# Local users may interrogate the ntp server more closely.

restrict 127.0.0.1

restrict ::1

#增加214作为时间服务器即可

server 192.168.0.214

# Needed for adding pool entries

restrict source notrap nomodify noquery

# Clients from this (example!) subnet have unlimited access, but only if

# cryptographically authenticated.

#restrict 192.168.123.0 mask 255.255.255.0 notrust

# If you want to provide time to your local subnet, change the next line.

# (Again, the address is an example only.)

#broadcast 192.168.123.255

# If you want to listen to time broadcasts on your local subnet, de-comment the

# next lines. Please do this only if you trust everybody on the network!

#disable auth

#broadcastclient

#Changes recquired to use pps synchonisation as explained in documentation:

#http://www.ntp.org/ntpfaq/NTP-s-config-adv.htm#AEN3918

#server 127.127.8.1 mode 135 prefer # Meinberg GPS167 with PPS

#fudge 127.127.8.1 time1 0.0042 # relative to PPS for my hardware

#server 127.127.22.1 # ATOM(PPS)

#fudge 127.127.22.1 flag3 1 # enable PPS API

退出保存，重启ntp服务

执行 service ntp restart

(4) 查看ntp服务是否配置完成

在ntp sever上执行 ntpq-p

在ntp client上执行 ntpq–p

即完成ntp服务的配置

2.6 上传安装文件

通过WinSCP软件，登录主机hadoop001。实现本地机器与远程机器的文件共享。将本机下的：hadoop2.7.4和jdk 1.8和zookeeper3.4.9 和hive2.2复制到hadoop001机器/opt/soft目录下。

注意：可以通过wincp软件进行本地拷贝

3. Zookeeper集群搭建

3.1 zookeeper安装包解压

首先将zookeeper安装包拷贝到hadoop001服务器/opt/soft目录下,然后执行解压命令

tar -zxvf zookeeper-3.4.9.tar.gz

解压完成即得到 zookeeper安装包

3.2 zookeeper配置安装

切换目录: cd /opt/soft/zookeeper-3.4.9/conf/

执行命令：cpzoo_sample.cfg zoo.cfg

复制一份zookeeper的配置文件，以便于进行配置

执行以下命令编辑文件：vim zoo.cfg

加入以下参数：

dataDir=/opt/data/zookeeper

dataLogDir=/opt/data/zookeeper/logs

在文件最后添加：

server.1=hadoop001:2888:3888

server.2=hadoop002:2888:3888

server.3=hadoop003:2888:3888

具体参数如下图：

然后退出保存。

然后创建文件夹，执行以下命令：

mkdir -p/opt/data/zookeeper

mkdir -p/opt/data/zookeeper/logs

创建zookeeper的data存放目录

然后在创建zookeeper的myid空文件：

touch/opt/data/zookeepe/myid

最后向该文件写入ID

echo 1> /opt/data/zookeepe/myid

3.3 将配置好的zookeeper拷贝到其他节点

scp -r zookeeper-3.4.9 hadoop002:/opt/soft/

scp -r zookeeper-3.4.9 hadoop003:/opt/soft/

然后分别在每台机器上执行

然后创建文件夹，执行以下命令：

mkdir -p /opt/data/zookeeper

mkdir -p/opt/data/zookeeper/logs

创建zookeeper的data存放目录

然后在创建zookeeper的myid空文件：

touch/opt/data/zookeepe/myid

最后向该文件写入ID

hadoop002：echo 2> /opt/data/zookeepe/myid

hadoop003：echo 3> /opt/data/zookeepe/myid

3.4 修改环境变量

在安装zookeeper服务器上的hadoop用用户下执行：

cd /home/hadoop vim .bash_profile

把以下内容加入到其中

exportZOOKEEPER_HOME=/opt/soft/zookeeper-3.4.9/

export PATH=$PATH:$ZOOKEEPER_HOME/bin

退出保存，然后执行 source .bash_profile 使其生效

3.5 zookeeper启动与测试

在每台机器上执行以下命令

zkServer.shstart

然后在执行 zkServer.sh status .有一个leader，两个follower，即正常启动

3.6 修改Zookeeper日志输出路径

如果不做修改，默认zookeeper的日志输出信息都打印到了zookeeper.out文件中，这样输出路径和大小没法控制，因为日志文件没有轮转。所以需要修改日志输出方式。具体操作如下：

1、修改$ZOOKEEPER_HOME/bin目录下的zkEnv.sh文件，ZOO_LOG_DIR指定想要输出到哪个目录，ZOO_LOG4J_PROP，指定INFO,ROLLINGFILE的日志APPENDER.

2、修改$ZOOKEEPER_HOME/conf/log4j.properties文件的：zookeeper.root.logger的值与前一个文件的ZOO_LOG4J_PROP保持一致，该日志配置是以日志文件大小轮转的，如果想要按照天轮转，可以修改为DaliyRollingFileAppender.

4. Hadoop集群搭建

4.1 hadoop压缩包解压

登录到hadoop001服务器上，移动hadoop安装包到/opt/soft下

执行解压命令: tar -zxvf hadoop-2.7.6.tar.gz 解压文件

然后执行创建文件夹命令：

mkdir -p /opt/data/hadoop/tmp

mkdir -p /opt/data/hadoop/dfs/data

mkdir -p /opt/data/hadoop/ dfs/name

4.2 hadoop文件配置

4.2.1 配置 JAVA_HOME

进入目录：cd /opt/soft/hadoop-2.7.6/etc/hadoop

配置文件:hadoop-env.sh,打开它修改JAVA_HOME值为(

export JAVA_HOME= /opt/soft/jdk1.8.0_171

export HADOOP_LOG_DIR=/opt/data/hadoop/logs

在以下yarn-size.xml配置的文件目录

配置文件:yarn-env.sh,打开它修改JAVA_HOME值为(

export JAVA_HOME= /opt/soft/jdk1.8.0_171

export HADOOP_LOG_DIR=/opt/data/hadoop/logs

4.2.2 配置slaves

配置文件:slaves，打开它写入内容(写入nodename结点即可)：

执行命令vim slaves 加入以下参数：

hadoop001

hadoop002

hadoop003

退出保存

4.2.3 配置core-site.xml

fs.defaultFS

hdfs://beh ###hdfs的命名空间

io.file.buffer.size

131072

hadoop.tmp.dir

/opt/data/hadoop/tmp ###自己创建的临时目录

Abase for other temporary directories.

ha.zookeeper.quorum ### zookeeper集群

hadoop001:2181,hadoop002:2181,hadoop003:2181 -

hadoop.proxyuser.root.hosts

hadoop.proxyuser.root.groups

注：汉字部分不要加入文件，标红参数根据需要修改

4.2.4 配置hdfs-site.xml

dfs.nameservices

beh ###命名空间和cor-site.xml

dfs.ha.namenodes.beh

hadoop001,hadoop002 ###主节点主机名

dfs.namenode.rpc-address.beh.hadoop001

hadoop001:9000

dfs.namenode.http-address.beh.hadoop001

hadoop001:50070

dfs.namenode.rpc-address.beh.hadoop002

hadoop002:9000

dfs.namenode.http-address.beh.hadoop002

hadoop002:50070

dfs.namenode.shared.edits.dir ###与zookeeper保持一致

qjournal://hadoop001:8485;hadoop002:8485;hadoop003:8485/beh

dfs.journalnode.edits.dir

/opt/data/hadoop/journal

dfs.ha.automatic-failover.enabled

true

dfs.client.failover.proxy.provider.beh

org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider

dfs.ha.fencing.methods

sshfence

dfs.ha.fencing.ssh.private-key-files

/hadoop/.ssh/id_rsa ###无密码登录一致，一般默认

dfs.namenode.name.dir

file:/opt/data/hadoop/dfs/name

dfs.datanode.data.dir

file:/opt/data/hadoop/dfs/data

dfs.replication

dfs.webhdfs.enabled

true

dfs.journalnode.http-address

0.0.0.0:8480

dfs.journalnode.rpc-address

0.0.0.0:8485

ha.zookeeper.quorum

hadoop001:2181,hadoop002:2181,hadoop003:2181

注：汉字部分不要加入文件，标红参数根据需要修改

4.2.5 配置mapred-site.xml

mapreduce.framework.name

yarn

mapreduce.jobhistory.address

0.0.0.0:10020

mapreduce.jobhistory.webapp.address

0.0.0.0:19888

4.2.6 配置yarn-site.xml

yarn.resourcemanager.connect.retry-interval.ms

2000

yarn.resourcemanager.ha.enabled

true

yarn.resourcemanager.ha.rm-ids

rm1,rm2 ##两个yarn节点

ha.zookeeper.quorum

hadoop001:2181,hadoop002:2181,hadoop003:2181

yarn.resourcemanager.ha.automatic-failover.enabled

true

yarn.resourcemanager.hostname.rm1

hadoop001

yarn.resourcemanager.hostname.rm2

hadoop002

yarn.resourcemanager.ha.id

rm1 ##这个是当前机器yarn节点，在热备需要改为rm2

If we want to launch more than one RM in single node, we need this configuration

yarn.resourcemanager.recovery.enabled

true

yarn.resourcemanager.zk-state-store.address

hadoop001:2181,hadoop002:2181,hadoop003:2181

yarn.resourcemanager.store.class

org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore

yarn.resourcemanager.zk-address

hadoop001:2181,hadoop002:2181,hadoop003:2181

yarn.resourcemanager.cluster-id

beh-yarn ##与之前的命名空间保持一致

yarn.app.mapreduce.am.scheduler.connection.wait.interval-ms

5000

yarn.resourcemanager.address.rm1

hadoop001:8132

yarn.resourcemanager.scheduler.address.rm1

hadoop001:8130

yarn.resourcemanager.webapp.address.rm1

hadoop001:23188

yarn.resourcemanager.resource-tracker.address.rm1

hadoop001:8131

yarn.resourcemanager.admin.address.rm1

hadoop001:8033

yarn.resourcemanager.ha.admin.address.rm1

hadoop001:23142

yarn.resourcemanager.address.rm2

hadoop002:8132

yarn.resourcemanager.scheduler.address.rm2

hadoop002:8130

yarn.resourcemanager.webapp.address.rm2

hadoop002:23188

yarn.resourcemanager.resource-tracker.address.rm2

hadoop002:8131

yarn.resourcemanager.admin.address.rm2

hadoop002:8033

yarn.resourcemanager.ha.admin.address.rm2

hadoop002:23142

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class

org.apache.hadoop.mapred.ShuffleHandler

yarn.nodemanager.local-dirs

/opt/data/hadoop/yarn

yarn.nodemanager.log-dirs

/opt/data/hadoop/logs

mapreduce.shuffle.port

23080

yarn.client.failover-proxy-provider org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider

yarn.resourcemanager.ha.automatic-failover.zk-base-path

/yarn-leader-election

Optional setting. The default value is /yarn-leader-election

注：汉字部分不要加入文件，标红参数根据需要修改，文件夹需要自己创建

4.3 hadoop分发其他机器

执行以下命令将安装包分发

scp -r hadoop-2.7.6 hadoop002:/opt/soft/

scp -r hadoop-2.7.6 hadoop003:/opt/soft/

4.4 Hadoop环境变量配置

在每台服务器上的hadoop用用户下执行：

cd/home/hadoop vim .bash_profile

把以下内容加入到其中

export HADOOP_HOME=/opt/soft/hadoop-2.7.6/

exportPATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

退出保存，然后执行 source .bash_profile 使其生效

4.5 启动测试集群

4.5.1 启动zookeeper集群

分别在hadoop001，hadoop002，hadoop003上执行

zkServer.sh start 启动zookeeper

然后查看状态 ./zkServer.sh status

（一个leader，两个follower）zookeeper正常启动

4.5.2 格式化HDFS的Zookeeper存储目录

在 hadoop001上执行（只需在一个 zookeeper 节点执行即可）：hdfs zkfc –formatZK

4.5.3 启动 JournalNode 集群

所有 journalnode 节点上分别执行：

hadoop-daemon.shstart journalnode

4.5.4 格式化并启动第一个 NameNode

选择 hadoop001

##格式化当前节点的 namenode 数据

hdfs namenode -format

##格式化 journalnode 的数据，这个是 ha 需要做的

hdfs namenode -initializeSharedEdits

##启动当前节点的 namenode 服务

hadoop-daemon.sh start namenode

4.5.5 格式化并启动第二个 NameNode

在 hadoop002执行：

##启 hadoop001已经格式化过，然后同步至 hadoop002

hdfs namenode -bootstrapStandby

##启动当前节点的 namenode 服务

hadoop-daemon.sh start namenode

4.5.6 启动所有DataNode

#每个 datanode 上执行hadoop-daemon.sh start datanode

4.5.7 启动 ZooKeeperFailoverController

所有 namenode 节点分别执行：

hadoop-daemon.sh start zkfc

4.5.8 登陆 namenode 服务器 web 端查看服务器状态

此时登陆 http://hadoop001:50070与 http://haoop002:50070

其中一个为 active 另一个为 standby 状态。

这里如果 PC 连接服务器使用浏览器需要输入IP_ADDRESS:50070来进行访问

4.5.9 启动YARN

在hadoop001上执行

start-yarn.sh

4.5.10 hadoop002 上启动 resourcemanager

yarn-daemon.sh start resourcemanager

4.5.11 登陆 resourcemanager 服务器 web 端查看服务器状态

此时登陆 http://hadoop001:23188与 http://haoop002:23188

其中一个为 active 另一个为 standby 状态。活跃节点可以正常访问，备用节点会自动跳转至活跃节

点的 web 地址。

http://resourcemanager_ipaddress:23188

这里如果 PC 连接服务器使用浏览器需要输入IP_ADDRESS:23188来进行访问。

4.5.12 测试集群性能

测试集群是否可能，热备是否切换等性能

5. Hive集群搭建

5.1 hive压缩包解压配置环境变量

登录到hadoop001服务器上，移动hadoop安装包到/opt/soft下

执行解压命令: tar -zxvf apache-hive-2.2.0-bin.tar.gz解压文件

在每台服务器上的hadoop用用户下执行：

cd /home/hadoop vim .bash_profile

把以下内容加入到其中

export HIVE_HOME=/opt/soft/hive-2.2.0

export HIVE_CONF_DIR=$HIVE_HOME/conf

export CLASSPATH=$CLASSPATH:$HIVE_HOME/lib

export PATH=$PATH:$HIVE_HOME/bin

5.2 安装mysql

配置MySQL(注:切换到root用户)

卸载CentOS自带的MySQL

rpm -qa | grep mysql

rpm -e mysql-libs-5.1.66-2.el6_3.i686--nodeps

yum -y install mysql-server

初始化MySQL

(1)修改mysql的密码(root权限执行)

cd /usr/bin

./mysql_secure_installation

(2)输入当前MySQL数据库的密码为root, 初始时root是没有密码的, 所以直接回车

Enter current password for root (enter fornone):

(3)设置MySQL中root用户的密码(应与下面Hive配置一致,下面设置为123456)

Set root password? [Y/n] Y

New password:

Re-enter new password:

Password updated successfully!

Reloading privilege tables..

... Success!

(4)删除匿名用户

Remove anonymous users? [Y/n] Y

... Success!

(5)是否不允许用户远程连接,选择N

Disallow root login remotely? [Y/n] N

... Success!

(6)删除test数据库

Remove test database and access to it?[Y/n] Y

Dropping test database...

... Success!

Removing privileges on test database...

... Success!

(7)重装

Reload privilege tables now? [Y/n] Y

... Success!

(8)完成

All done! If you've completed all of the above steps, your MySQL

installation should now be secure.

Thanks for using MySQL!

(9)登陆mysql

mysql -uroot -p

GRANT ALL PRIVILEGES ON *.* TO 'root'@'%'IDENTIFIED BY '123' WITH GRANT OPTION;

FLUSH PRIVILEGES;

exit;

至此MySQL配置完成

5.3 配置hive

5.3.1 编辑`hive-env.xml`文件

将hive-env.sh.template文件复制为hive-env.sh, 编辑hive-env.xml文件

JAVA_HOME=/opt/soft/jdk1.8.0_171

HADOOP_HOME=/opt/soft/hadoop-2.7.6

HIVE_HOME=/opt/soft/hive-2.2.0

export HIVE_CONF_DIR=$HIVE_HOME/conf

export HIVE_AUX_JARS_PATH=$SPARK_HOME/lib/spark-assembly-1.6.0-hadoop2.6.0.jar

export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$HADOOP_HOME/lib:$HIVE_HOME/lib

export HADOOP_OPTS="-Dorg.xerial.snappy.tempdir=/tmp -Dorg.xerial.snappy.lib.name=libsnappyjava.jnilib $HADOOP_OPTS"

5.3.2 编辑hive-site.xml文件

配置hive-site.xml文件, 将hive-default.xml.template文件拷贝为hive-default.xml, 并编辑hive-site.xml文件(删除所有内容，只留一个)

配置项参考:

hive.server2.thrift.port– TCP的监听端口，默认为10000。

hive.server2.thrift.bind.host– TCP绑定的主机，默认为localhost

hive.server2.thrift.min.worker.threads– 最小工作线程数，默认为5。

hive.server2.thrift.max.worker.threads – 最小工作线程数，默认为500。

hive.server2.transport.mode – 默认值为binary（TCP），可选值HTTP。

hive.server2.thrift.http.port– HTTP的监听端口，默认值为10001。

hive.server2.thrift.http.path – 服务的端点名称，默认为cliservice。hive.server2.thrift.http.min.worker.threads– 服务池中的最小工作线程，默认为5。hive.server2.thrift.http.max.worker.threads– 服务池中的最小工作线程，默认为500。

Hive-site文件

javax.jdo.option.ConnectionURL

jdbc:mysql://hadoop003:3306/hive?createDatabaseIfNotExist=true

JDBC connect string for a JDBC metastore

javax.jdo.option.ConnectionDriverName

com.mysql.jdbc.Driver

Driver class name for a JDBC metastore

javax.jdo.option.ConnectionUserName

root

username to use against metastore database

javax.jdo.option.ConnectionPassword

root

password to use against metastore database

datanucleus.autoCreateSchema

true

datanucleus.autoCreateTables

true

datanucleus.autoCreateColumns

true

hive.metastore.warehouse.dir

/hive

location of default database for the warehouse

hive.downloaded.resources.dir

/opt/data/hive/tmp/resources

Temporary local directory for added resources in the remote file system.

hive.exec.dynamic.partition

true

hive.exec.dynamic.partition.mode

nonstrict

hive.exec.local.scratchdir

/opt/data/hive/tmp/HiveJobsLog

Local scratch space for Hive jobs

hive.downloaded.resources.dir

/opt/data/hive/tmp/ResourcesLog

Temporary local directory for added resources in the remote file system.

hive.querylog.location

/opt/data/hive/tmp/HiveRunLog

Location of Hive run time structured log file

hive.server2.logging.operation.log.location

/opt/data/hive/tmp/OpertitionLog

Top level directory where operation tmp are stored if logging functionality is enabled

hive.hwi.war.file

/opt/soft/hive-2.2.0/lib/hive-hwi-2.2.0.jar

This sets the path to the HWI war file, relative to ${HIVE_HOME}.

hive.hwi.listen.host

hadoop003

This is the host address the Hive Web Interface will listen on

hive.hwi.listen.port

9999

This is the port the Hive Web Interface will listen on

hive.server2.thrift.bind.host

hadoop003

hive.server2.thrift.port

10000

hive.server2.thrift.http.port

10001

hive.server2.thrift.http.path

cliservice

hive.server2.webui.host

hadoop003

hive.server2.webui.port

10002

hive.scratch.dir.permission

755

hive.server2.enable.doAs

false

hive.auto.convert.join

false

spark.dynamicAllocation.enabled

true

动态分配资源

spark.driver.extraJavaOptions

-XX:PermSize=128M -XX:MaxPermSize=512M

5.4 配置hive-config.sh文件

配置$HIVE_HOME/conf/hive-config.sh文件

## 增加以下三行

exportJAVA_HOME=/opt/soft/jdk1.8.0_171

exportHIVE_HOME=/opt/soft/hive-2.2.0

exportHADOOP_HOME=/opt/soft/hadoop-2.7.6

## 修改下列该行

HIVE_CONF_DIR=$HIVE_HOME/conf

5.5 拷贝JDBC包

将JDBC的jar包放入$HIVE_HOME/lib目录下

cp /home/hadoop/mysql-connector-java-5.1.6-bin.jar /opt/soft/hive-2.2.0/lib/

5.6 拷贝jline扩展包

将$HIVE_HOME/lib目录下的jline-2.12.jar包拷贝到$HADOOP_HOME/share/hadoop/yarn/lib目录下,并删除$HADOOP_HOME/share/hadoop/yarn/lib目录下旧版本的jline包

5.7 拷贝tools.jar包

复制$JAVA_HOME/lib目录下的tools.jar到$HIVE_HOME/lib下

cp  $JAVA_HOME/lib/tools.jar  ${HIVE_HOME}/lib

5.8 执行初始化Hive操作

选用MySQLysql和Derby二者之一为元数据库

注意:先查看MySQL中是否有残留的Hive元数据,若有,需先删除

schematool -dbType mysql -initSchema ## MySQL作为元数据库

其中mysql表示用mysql做为存储hive元数据的数据库, 若不用mysql做为元数据库, 则执行

schematool -dbType derby -initSchema ## Derby作为元数据库

脚本hive-schema-1.2.1.mysql.sql会在配置的Hive元数据库中初始化创建表

5.9 启动Metastore服务

执行Hive前, 须先启动metastore服务, 否则会报错

./hive --service metastore

然后打开另一个终端窗口,之后再启动Hive进程

5.10 测试

hive
show databases;
show tables;
create table book (id bigint, name string) row format delimited fields terminated by '\t'; 
select * from book;
select count(*) from book;

你可能感兴趣的:(基于原生态hadoop2.7.9 HA集群搭建)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
在Ubuntu中编译含有JSON的文件出现报错芝麻糊76 Linux kill_bug linux ubuntu json
在ubuntu中进行JSON相关学习的时候，我发现了一些小问题，决定与大家进行分享，减少踩坑时候出现不必要的时间耗费截取部分含有JSON部分的代码进行展示char*str="{\"title\":\"JSONExample\",\"author\":{\"name\":\"JohnDoe\",\"age\":35,\"isVerified\":true},\"tags\":[\"json\",\"
Xinference如何注册自定义模型玩人工智能的辣条哥人工智能 AI 大模型 Xinference
环境：Xinference问题描述：Xinference如何注册自定义模型解决方案：1.写个model_config.json，内容如下{"version":1,"context_length":2048,"model_name":"custom-llama-3","model_lang":["en","ch"],"model_ability":["generate","chat"],"model
STM32中的计时与延时 lupinjia STM32 stm32 单片机
前言在裸机开发中，延时作为一种规定循环周期的方式经常被使用，其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数，而且精度也还挺好，为什么不用呢？实际上HAL_Delay中有不少坑，而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来还是得加强外设原理的学习和理解，切不可只依赖HAL库。除了延时之外，我们在开发中有时也会想要确定某段程序的耗时，这就需要
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

基于原生态hadoop2.7.9 HA集群搭建

2. 服务器准备

2.1 关闭服务器防火墙

2.2 修改主机名

2.3 修改主机hosts

2.4 ssh免密登录设置

2.5 ntp时间同步配置

2.6 上传安装文件

3. Zookeeper集群搭建

3.1 zookeeper安装包解压

3.2 zookeeper配置安装

3.3 将配置好的zookeeper拷贝到其他节点

3.4 修改环境变量

3.5 zookeeper启动与测试

3.6 修改Zookeeper日志输出路径

4. Hadoop集群搭建

4.1 hadoop压缩包解压

4.2 hadoop文件配置

4.2.1 配置 JAVA_HOME

4.2.2 配置slaves

4.2.3 配置core-site.xml

4.2.4 配置hdfs-site.xml

4.2.5 配置mapred-site.xml

4.2.6 配置yarn-site.xml

4.3 hadoop分发其他机器

4.4 Hadoop环境变量配置

4.5 启动测试集群

4.5.1 启动zookeeper集群

4.5.2 格式化HDFS的Zookeeper存储目录

4.5.3 启动 JournalNode 集群

4.5.4 格式化并启动第一个 NameNode

4.5.5 格式化并启动第二个 NameNode

4.5.6 启动所有DataNode

4.5.7 启动 ZooKeeperFailoverController

4.5.8 登陆 namenode 服务器 web 端查看服务器状态

4.5.9 启动YARN

4.5.10 hadoop002 上启动 resourcemanager

4.5.11 登陆 resourcemanager 服务器 web 端查看服务器状态

4.5.12 测试集群性能

5. Hive集群搭建

5.1 hive压缩包解压配置环境变量

5.2 安装mysql

5.3 配置hive

5.3.1 编辑hive-env.xml文件

5.3.2 编辑hive-site.xml文件

5.4 配置hive-config.sh文件

5.5 拷贝JDBC包

5.6 拷贝jline扩展包

5.7 拷贝tools.jar包

5.8 执行初始化Hive操作

5.9 启动Metastore服务

5.10 测试

你可能感兴趣的:(基于原生态hadoop2.7.9 HA集群搭建)

5.3.1 编辑`hive-env.xml`文件