Spark提交任务的命令

bin/spark-submit --master spark://master.hadoop:7077,slave1.hadoop:7077 --executor-memory 512mb --total-executor-cores 4

--class nuc.sw.test.ScalaWordCount /root/spark-1.0.jar hdfs://master.hadoop:9000/input hdfs://master.hadoop:9000/output

解释:

bin/spark-submit

--master  指定master的位置如果有多个任务,用逗号分隔。spark://master.hadoop:7077,slave1.hadoop:7077

--executor-memory  指定运行时候的内存 512mb(每个机器上)

--total-executor-cores 指定核数(整个任务总共的核数)

--class  指定main方法的类名    jar包的路径   输入路径  输出路径

你可能感兴趣的:(大数据学习笔记,Spark)