Spark学习-SparkSQL--04-SparkSQL CLI 单节点运行与yarn集群运行

1。单节点运行

 bin/spark-sql --master spark://bigdata01.hzjs.co:7077 --executor-memory 40g --total-executor-cores 50 --conf spark.sql.warehouse.dir=hdfs://bigdata01.hzjs.co:8020/user/sparksql --conf spark.driver.maxResultSize=4g
 

缺点:数据量特别大会造成集群任务死掉

2。集群运行

bin/spark-sql --master yarn-client --executor-memory 80g --conf spark.sql.warehouse.dir=hdfs://bigdata01.hzjs.co:8020/user/sparksql --conf spark.driver.maxResultSize=10g

你可能感兴趣的:(大数据-spark)