1. Apache Zeppelin0.9.0 CDH6.2.0 下 安装记录和spark示例运行

版本:

  1. Zeppelin :Apache Zeppelin0.9.0
  2. OS:CentOs 7
  3. 大数据组件:CDH 6.2.0对应版本
  4. JAVA:1.8

一、安装步骤

1.下载Apache Zeppelin0.9.0

wget https://mirror.bit.edu.cn/apache/zeppelin/zeppelin-0.9.0-preview1/zeppelin-0.9.0-preview1-bin-all.tgz

2.解压

tar -xvf zeppelin-0.9.0-preview1-bin-all.tgz

3.修改配置文件

cd $ZEPPELIN_HOME/conf
vim zeppelin-env.sh

export HADOOP_CONF_DIR=/etc/hadoop/conf
export SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark
export FLINK_HOME=/opt/software/flink
export HIVE_HOME=/opt/cloudera/parcels/CDH/lib/hive
export HIVE_CONF_DIR=/etc/hive/conf
export ZEPPELIN_ADDR=ip
export ZEPPELIN_PORT=port

注意:host就是要安装的服务器ip,port要用一个不常用的,避免端口占用问题

4.启动

cd $ZEPPELIN_HOME/bin
sh zeppelin-daemon.sh start

5.打开浏览器,输入url

http://ip:port

看到如下界面说明已经安装成功了
1. Apache Zeppelin0.9.0 CDH6.2.0 下 安装记录和spark示例运行_第1张图片

6.运行spark官方示例

1.点击Spak Tutorial

1. Apache Zeppelin0.9.0 CDH6.2.0 下 安装记录和spark示例运行_第2张图片

2.点击Spark Basic Features

1. Apache Zeppelin0.9.0 CDH6.2.0 下 安装记录和spark示例运行_第3张图片

3.点击右上角三角型按钮运行

此处代码做的事是读取文件注册为一个名字叫bank的临时表
1. Apache Zeppelin0.9.0 CDH6.2.0 下 安装记录和spark示例运行_第4张图片可以看到日志没有报错,右上角状态为finish
1. Apache Zeppelin0.9.0 CDH6.2.0 下 安装记录和spark示例运行_第5张图片

4.依次点击按钮执行下方的任务

这三个任务做的事都是查询上面注册的叫bank的临时表,下方的图表是结果
1. Apache Zeppelin0.9.0 CDH6.2.0 下 安装记录和spark示例运行_第6张图片下图是执行结果,从下方图表、日志和状态来看,3个任务都已执行成功
1. Apache Zeppelin0.9.0 CDH6.2.0 下 安装记录和spark示例运行_第7张图片注意:Spark Basic Features 第2次执行Load datainto table时会报错。
解决:
https://blog.csdn.net/qq_39945938/article/details/107230571


参考链接:

Apache Zeppelin0.9.0官方文档
参考的一位大佬的文档

你可能感兴趣的:(Apache,Zeppelin)