大数据学习(zookeeper,hbase,hive,sqoop2的搭建)

大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第1张图片

一、Zookeeper的安装和配置

1.解压文件

2.进入解压目录,配置相关文件

2.1 修改conf文件夹下的zoo_sample.cfg,重命名为zoo.cfg

打开进入,修改Datadir,并添加如下语句

dataDir=/usr/share/zookeeper-3.5.0-alpha/data

dataLogDir=/usr/share/zookeeper-3.5.0-alpha/logs

server.0=Master:2888:3888

server.1=Slave1:2888:3888

server.2=Slave2:2888:3888

记得”3888”后不要有空格!然后我们创建设置的文件夹

最后再在data下创建myid文件,值设为0

最后把主节点的zookeeper复制到从节点,并修改myid分别为1, 2

2.2 启动zookeeper集群

移动到解压目录下的bin文件夹

在三个节点上执行./zkServer.sh start

最后用./zkServer.sh status命令查看

三个节点查看后,一共两个follower,一个leader,配置成功。(leader不一定是在master上,因为它有自己的选举机制)



二、Hbase的安装与配置

Hbase是一种非关系型数据库,NoSQL,但其实是有两种解释的:not sql 和 not only sql,怎么说呢,应该是介于两者之间的。NoSQL的特点是使用键值对存储数据和分布式,并且读写性能很高,适合我们大数据下的工作。接下来是具体的配置过程。

1.解压文件

2.为.bashrc文件添加环境变量

然后source一下

1.进入解压目录下的conf文件,配置相关信息

3.1 编辑hbase-site.xml,添加如下信息

大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第2张图片

其中hbase.rootdir端口必须与你的Hadoop集群的core-site.xml文件配置保持完全一致

(这里的Mastre打错了,应该是Master)

3.2 编辑hbase-env.sh,在末尾添加如下

因为hbase运行在zookeeper的基础之上,这个东西就是告诉它我们配置了zookeeper,你用我们配置的,而不是你自带的。

3.3 编辑regionservers,添加从节点

4.通过scp命令把hbase发送到从节点上,并为从节点配置环境变量

5.先启动hadoop,然后再启动zookeeper集群

6.进入hbase文件bin目录下,执行 ./start-hbase.sh

再用jps命令分别查看主节点和从节点,启动成功。

大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第3张图片
大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第4张图片

三、Hive的安装与配置

Hbase是一种数据库,而Hive则是一种数据仓库,建立在Hadoop的基础上,提供了一系列工具可供数据的提取转化和加载,这是一种的存储、查询、分析存储在Hadoop中的大规模数据的机制。

具体安装流程如下:

1.解压,设置环境变量并随手source一下

2.进入hadoop目录下,修改etc下的配置文件hadoop-env.sh,添加如下

3.进入解压目录的conf文件夹下

3.1 把hive-default.xml.template重名命为hive-site.xml

3.2 把hive-env.sh.template重命名为hive-env.sh,并添加如下内容

4.进入解压目录的bin文件夹下,修改hive-config.sh文件

4.接下来是和MySQL的连接(之前已经安装好了)

5.1先从官网上下载驱动包

大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第5张图片

将mysql-connector-java-5.1.43-bin.jar包解压到hive目录下的lib文件夹中

5.2修改 conf文件夹下的hive-site.xml文件,只需修改如下四个点

大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第6张图片

这一个value值为你root下MySQL的真实密码

*5.3 有些可能还需要修改另三个属性hive.exec.scratchdir,hive.exec.local.scratchdir,hive.downloaded.resources.dir,把他们的值设置为绝对路径,否则后面启动会出错

6.通过mysql给hive权限,登录mysql

5.1执行

GRANT ALL PRIBILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '**your password**' WITH GRANT OPTION;

flush privileges;

大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第7张图片

select user,host from mysql.user;

6.2修改/etc/mysql/mysql.conf.d/mysqld.cnf 文件,注释掉如下这一行

6.3 重启mysql服务sudo /etc/init.d/mysql restart

7.启动hadoop,再进入hive进行操作

执行hive

执行CREATE TABLE test2(id int,name string); 创建一个新表

执行SHOW TABLES; 可以看到我们创建的表已经在里面了

大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第8张图片

四、Sqoop 1.99.7的安装与配置

Sqoop是一个转换工具,用于在关系型数据库与HDFS之间进行数据转换。

1.解压,设置环境变量并随手source一下

2.进入解压目录下的conf文件夹下

2.1 配置sqoop.properties

org.apache.sqoop.submission.engine.mapreduce.configuration.directory=/home/ubuntu17/hadoop-3.0.0-alpha4/etc/hadoop

org.apache.sqoop.security.authentication.type=SIMPLE

org.apache.sqoop.security.authentication.handler=org.apache.sqoop.security.authentication.SimpleAuthenticationHandler

org.apache.sqoop.security.authentication.anonymous=true

3.配置Hadoop代理访问

找到Hadoop的core-site.xml配置文件

大数据学习(zookeeper,hbase,hive,sqoop2的搭建)_第9张图片

这里的ubuntu17是指你用什么用户在访问,如果你使用root的话,就把ubuntu17修改为root

4.配置驱动文件

一般我们使用的数据库驱动包都没有随着Sqoop一起释出,多半是因版权问题,所以将这些包放置在这个第三方组件下。再在配置一个SQOOP_SERVER_EXTRA_LIB系统变量即可,指定路径为$SQOOP_HOME/extra,最后把mysql的驱动jar文件复制到这个目录下。

5.启动sqoop服务

在解压目录的bin文件夹下执行

./sqoop2-tool upgrade

./sqoop2-tool verify

./sqoop2-server start

出现了SqoopJettyServer则成功。

6.执行

sqoop2-tool upgrade  初始化

sqoop2-tool verify  检查是否配置正确

sqoop2-shell 进入shell操作界面



至此结束,如果有错误的话欢迎指出(~ ̄▽ ̄)~


你可能感兴趣的:(大数据学习(zookeeper,hbase,hive,sqoop2的搭建))