数据可视化:Zeppelin+spark

阅读更多

一.序言

     最近需要常见数据可视化的东西,主要是方便spark-sql ,方便内部操作方便,因此选择了个数据可视化的,hue 和 zepplin ,hue 是比较强大的,但是spark 方便也是孵化状态,是非apache 的, 先尝试下 Zeppelin 部署,最新0.6的不稳定,编译不过去,就用0.5吧。

     下载地址:https://github.com/apache/incubator-zeppelin/releases

 

二.编译:

     1.解压:

      

tar -zxvf incubator-zeppelin-0.5.0.tar.gz 

 

     2.编译:我是spark1.4.1 +hadoop 2.7.1,0.5 支持到 spark 1.4.0 hadoop 2.6 

    

mvn clean package -Pspark-1.4 -Dspark.version=1.4.1  -Dhadoop.version=2.7.1 -Phadoop-2.6 -DskipTests

 

     如果全部OK 就可以了,按描述的启动就行了:https://github.com/apache/incubator-zeppelin

     

 

三.其他问题:

     因为依赖maven  npm node.js 等,需要自己安装~。~ ,而且版本对应 自己去pom 里面去看看,如果出错,多半就是这个原因了。当然我把我编译好的 拿出来直接用吧,记得配置spark/hadoop home 哦

      下载地址:http://pan.baidu.com/s/1bnhUI6r

 

小结:

       1.这东西因为是孵化项目,变化挺快的,因此稍微麻烦点,纠结纠结就好。

       2.关于一些操作,就看文档吧

 

参考文档

http://zeppelin.incubator.apache.org/:

http://zeppelin.incubator.apache.org/docs/interpreter/spark.html

别人的安装例子:

http://blog.csdn.net/pelick/article/details/45934993

你可能感兴趣的:(Zeppelin,spark,hadoop,1.4.1)