Zeppelin是一个基于Web的notebook,提供交互数据分析和可视化。后台支持接入多种数据处理引擎,如spark,hive等。支持多种语言: Scala(Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等。
链接:http://zeppelin.apache.org/download.html
选择 zeppelin-0.8.1-bin-all.tgz
本文使用zepplin连接hive,所以需要虚拟机提前安装好hadoop以及hive
安装hadoop参考:https://blog.csdn.net/and52696686/article/details/107287066
安装hive参考:https://blog.csdn.net/and52696686/article/details/107007007
将下载好的安装包文件拖拽至之前创建好的linux系统 /opt/software 目录下
解压并重命名:
tar -zxvf zeppelin-0.8.1-bin-all.tgz -C /opt/install/
mv zeppelin-0.8.1-bin-all/ zeppelin081
切换至zeppelin配置文件conf目录下
cd /opt/install/zeppelin/conf
复制并重命名
cp zeppelin-site.xml.template zeppelin-site.xml
vi zeppelin-site.xml
<!-- 修改端口配置,便于访问国外网站 -->
<property>
<name>zeppelin.helium.registry</name>
<value>helium</value>
</property>
修改端口号:默认是8080,为避免冲突,修改为其他端口号
修改后如图
在当前conf目录下拷贝zeppelin系统脚本并重命名
cp zeppelin-env.sh.template zeppelin-env.sh
编辑
vi zeppelin-env.sh
修改下图;两处红框位置 "JAVA_HOME路径"和 “HADOOP_CONF_DIR配置文件路径”
修改后:
切换至zeppelin/bin目录下,启动:
cd /opt/install/zeppelin081/bin
./zeppelin-daemon.sh start
启动成功如下图:会提示ok
在web端输入: 192.168.206.129:8000
zeppeline启动较慢,虚拟机界面提示启动成功需耐心等待一会才可以打开网页:
关闭 zeppelin:
./zeppelin-daemon.sh stop
Zepplin中没有默认的hive解释器,所以需要通过jdbc解释器进行添加
①:拷贝 hive/conf 文件夹下的 hive-site.xml 到zeppelin081/conf目录下
cp /opt/install/hive/conf/hive-site.xml /opt/install/zeppelin081/conf
②:拷贝jar包
拷贝下面两个jar包到zeppelin安装目录下 interperter/jdbc 中
hadoop/share/hadoop/common/hadoop-common-2.6.0-cdh5.14.2.jar
hive/lib/hive-jdbc-1.1.0-cdh5.14.2-standalone.jar
cp /opt/install/hadoop260/share/hadoop/common/hadoop-common-2.6.0-cdh5.14.2.jar /opt/install/zeppelin081/interpreter/jdbc/
cp /opt/install/hive/lib/hive-jdbc-1.1.0-cdh5.14.2-standalone.jar /opt/install/zeppelin081/interpreter/jdbc/
start-all.sh
zkServer.sh start
service mysql start
hive --service metastore #进程需独占一窗口
nohup hive --service hiveserver2 & #进程需独占一窗口
配置hive坏境前一定要确认beelin服务能正常启动,因为zeppelin中搭载hive环境是通过beeine来连接的
若之前启动过没有关闭不用再次启动
cd /opt/install/zeppelin081/bin
./zeppelin-daemon.sh start
网址:192.168.206.129:8000
①:右上角anonymous --> interpreter --> +Create新建一个叫做hive的集成环境
②:设置properties
创建分组名就叫做 hive ,分组为 jdbc
设置下图三处红框位置内容即可
default.driver : org.apache.hive.jdbc.HiveDriver
default.url : jdbc:hive2://192.168.42.200:10000
default.user : null
设置完成保存即可
在zepplin中,点击notebook,通过create new note创建一个notebook.
其中name可以任意,Default Interpreter选择hive
注意,zepplin中操作hive不能有分号
%hive
show databases
以上测试无报错信息,说明zeppelin连接hive成功!