Apache Zeppelin是一款基于web的notebook(类似于ipython的notebook),支持交互式地数据分析。原生就支持Spark、Scala、SQL 、shell, markdown等。开源
对于 Zeppelin 而言,并不依赖 Hadoop 集群环境,我们可以部署到单独的节点上进行使用
版本选择:
zeppelin两个版本区别:
zeppelin版本有两种分别是:zeppelin-0.8.0-bin-netinst.tgz和zeppelin-0.8.0-bin-all.tgz。
主要区别是:netinst是net -install的简写,就是Interpreters自己通过网络安装,具体安装教程可以查阅官方文档,地址为:http://zeppelin.apache.org/docs/0.7.0/manual/interpreterinstallation.html,例如spark interpreter的安装时:
./bin/install-interpreter.sh --name spark --artifact org.apache.zeppelin:zeppelin-spark_2.10:0.8.0(spark2.1.0版本)
而all版本则是Interpreters都集成在压缩包中,无需网络安装了。
1、解压安装
[hadoop@h3 software]$ tar -xzvf zeppelin-0.8.0-bin-all.tgz -C /opt/modules/
2、配置环境变量
[hadoop@h3 zeppelin-0.8.0]$ sudo vim /etc/profile
export ZEPPELIN_HOME=/opt/modules/zeppelin-0.8.0-bin-all
export PATH=$PATH:$ZEPPELIN_HOME/bin
[hadoop@h3 zeppelin-0.8.0]$ source /etc/profile #重载资源使其生效
4、修改zeppelin配置
[hadoop@h3 conf]$ cp zeppelin-env.sh.template zeppelin-env.sh
[hadoop@h3 conf]$ cp zeppelin-site.xml.template zeppelin-site.xml
[hadoop@h3 conf]$ sudo vim zeppelin-env.sh
添加:
export JAVA_HOME=/opt/modules/jdk1.8.0_181
export SPARK_HOME=/opt/modules/spark-2.1.0-bin-hadoop2.7
[hadoop@h3 conf]$ sudo vim zeppelin-site.xml
修改zeppelin.server.port
属性的值为其他不被占用的端口:
启动:zeppelin-daemon.sh start
浏览器查看:192.168.113.113:8090