大数据技术之 Spark 优化

1 Spark 性能调优

1.1 常规性能调优

1.1.1 常规性能调优一:最优资源配置

        Spark 性能调优的第一步,就是为任务分配更多的资源,在一定范围内,增加资源的分配与性能的提升是成正比的,实现了最优的资源配置后,在此基础上再考虑进行后面论述的性能调优策略。
        资源的分配在使用脚本提交 Spark 任务时进行指定,标准的 Spark 任务提交脚本如下所示:
bin/spark-submit \
--class com.atguigu.spark.Analysis \
--master yarn
--deploy-mode cluster
--num-executors 80 \
--driver-memory 6g \
--executor-memory 6g \
--executor-cores 3 \
/usr/opt/modules/spark/jar/spark.jar \
可以进行分配的资源如表所示:
名称
说明
--num-executors
配置 Executor 的数量
--driver-memory
配置 Driver 内存(影响不大)
--executor-memory
配置每个 Executor 的内存大小
--executor-cores
配置每个 Executor CPU core 数量

你可能感兴趣的:(spark,scala,大数据)