Oozie(HUE) 调度 Spark2

环境

JDK   1.8.0  
Scala 2.11.8  
Spark 2.1.2
Oozie 4.1
Hue   3.9 

yarn local 模式

  • 进入 Workspace

  • 进入 lib 目录,并上传 jar 和 配置文件

  • 拖拽 Spark Program

  • 选择刚才的 lib 目录

  • 填入 jar 名称,点击 add 确认

  • 填写业务主类名称,并配置参数

  • 点击小齿轮,查看其他参数


  • 保存配置

  • 提交运行

yarn cluster 模式

  • 进入 Workspace

  • 进入 lib 目录,并上传 jar 和 配置文件

  • 拖拽 Spark Program

  • Files 随便填,等会儿要删除,Jar name 填入完整 HDFS 路径
hdfs://localcluster/user/hue/oozie/workspaces/hue-oozie-1570773494.4/lib/DataWarehouse-1.0-SNAPSHOT.jar

  • 填写业务主类名称,点击减号删除 FILES,配置参数

hdfs://localcluster/user/hue/oozie/workspaces/hue-oozie-1570773494.4/lib/DataWarehouse-1.0-SNAPSHOT.jar
dw.user.qhy.wc.WordCount
--properties-file spark.properties
  • 点击小齿轮,查看其他参数

  • 将 client 改为 cluster

  • 保存配置

  • 提交运行

FAQ

  • 报类似如下错误(Attempt to add ... multiple times to the distributed cache)
Failing Oozie Launcher, Main class [org.apache.oozie.action.hadoop.SparkMain], main() threw exception, 
Attempt to add (hdfs://localcluster/user/hue/oozie/workspaces/hue-oozie-1570758098.65/lib/DataWarehouse-1.0-SNAPSHOT.jar) multiple times to the distributed cache.

可以参考这篇文章的处理方式: java.lang.IllegalArgumentException: Attempt to add (custom-jar-with-spark-code.jar) multiple times to the distributed cache


  • 报类似如下错误(kryo)
java.io.IOException: java.lang.NullPointerException
java.io.EOFException
com.esotericsoftware.kryo.KryoException

可能是因为不当的使用了 kryo 序列化器,最简单的解决方法是将

spark.serializer=org.apache.spark.serializer.KryoSerializer  

换回默认的

spark.serializer=org.apache.spark.serializer.JavaSerializer

进一步可参考这篇文章的解决方案:Spark2 的序列化(JavaSerializer/KryoSerializer)

本文出自 walker snapshot

你可能感兴趣的:(java,python,spark)