Spark 实践 - 客户端使用spark-submit提交Spark应用程序及注意事项

一、客户端提交spark应用程序

        是指在spark集群之外的机器,提交spark应用程序到spark集群运行。

二、spark-submit提交程序语法

        使用spark-submit工具提交Spark应用程序的语法:

./bin/spark-submit \
  --class  \
  --master  \
  --deploy-mode  \
  --conf = \
  ... # other options
   \
  [application-arguments]

--class 应用程序的入口类名;

--master spark 集群的url;

--deploy-mode 部署方式;

--conf 应用程序的sparkContext配置选项;

--application-jar 外部依赖;

--application-arguments 应用程序参数; 

三、在客户端使用spark-submit提交spark应用程序时需要注意的事项

        1)、客户端机器与spark集群必须互相知道,即相互ping得通;

        2)、如果应用程序中用到了本地文件,那么集群中的worker机器都必须有该文件,否则会报找不到文件;

        3)、windows客户端,如果应用程序中用到本地文件,那么无法提交到linux环境下的spark集群;

你可能感兴趣的:(Spark)