Spark之Shuffle机制和原理+源码解析

一、什么是spark shuffle

a). 我们举个例子reduceByKey会产生shuffle对吧,此算子会把上一个RDD每一个相同key的value聚合在一起形成一个新的value,生成一个新的RDD,类型还是形式,这样每一个key对应的就是一个聚合起来的value。
b). 每一个key对应的value不一定在同一个partition上,也不可能在同一个节点上,因为RDD是弹性分布式数据集,所以他的partition分布在各个节点上的。
c). Shuffle write 中每个map task 必须保证将自己处理的分区中的相同key的数据写到同一个分区文件中,可能会写入多个不同的分区文件。
d). Shullfe read 中 reduce task 会从上一个stage的所有 map task 所在的机器上寻找属于自己的那些分区文件,这样就可以保证相同key 的数据可以汇聚到同一个节点上去处理聚合。
e). reduce task 是根据key的hash值取模分区数,知道那些key对应的数据属于自己分区。
Spark的shuffle其实就是对MR任务shuffle进行了更细粒度的优化,我们直接源码分析

二、spark shuffle有几种

a). SortShuffleManager 普通运行机制,此方式会在map端对数据进行排序后落地磁盘。
b). SortShuffleManager bypass运行机制,次方式不会对数据进行排序
c).如果不需要进行排序操作,可以将spark.shuffle.sort.bypassMergeThreshold参数调大一些,此参数默认为200,reduce task任务个数小于此参数时,默认采用的是bypass机制,对的确不需要排序的作业,我们调大此参数可以减少排序的开销

三、源码解读

首先我们导入spark源码包,找到里面的SortShuffleManager类,打开StructurSpark之Shuffle机制和原理+源码解析_第1张图片
里面的
registerShuffle 注册shuffle,
getReader 写数据
getWriter 读数据

1、我们首先看registerShuffle
Spark之Shuffle机制和原理+源码解析_第2张图片
图片中 if 判断的第一次判断是否使用bypass机制,我们点进shouldBypassMergeSort会发现
Spark之Shuffle机制和原理+源码解析_第3张图片
第一个判断,如果有map端的combine,返回false,就不会采用bypass机制
第二个判断,如果partition的个数小于spark.shuffle.sort.bypassMergeThreshold的参数,才会进行bypass的方式
Spark之Shuffle机制和原理+源码解析_第4张图片
返回当map task 端没有combine 并partition的个数小于200个,就会采用bypass机制
Spark之Shuffle机制和原理+源码解析_第5张图片
接下来判断是否采用序列化的方式进行shuffle,次方式会存的更多,更高效Spark之Shuffle机制和原理+源码解析_第6张图片点进canUseSerializedShuffle我们可以发现又是一堆判断,
第一个判断:如果不支持序列化的文件,则返回false,不能采用序列化的形式写入buffer缓存区
第二个判断:如果没有定义分区器返回false,也不能采用序列化的形式写入buffer缓存区
第三个判断:如果分区数大于最大shuffle分区输出个数(谷歌翻译出来是这个,我也不知道什么意思),也不能采用序列化的形式写入buffer缓存区
以上条件都满足了,就会采用序列化的方式写入缓存区
Spark之Shuffle机制和原理+源码解析_第7张图片
最后会采用BaseShuffleHandle的方式写入缓存区

2、我们看getWriter
Spark之Shuffle机制和原理+源码解析_第8张图片
进入write方法,我们会发现,又是三个判断,
第一个:如果是序列化的shuffle方式,会采用UnsafeShuffleWriter对象进行write
第二个:如果是bypass机制,会采用BypassMergeSortShuffleWriter对象进行writer
第三个:如果是其他的,即采用了默认的SortShuffleWriter对象进行write,此方法和MR的shuffle方式一样。
总结:MR的shuffle是spark的shuffle的子集,spark shuffle做了更细粒度的划分

三、reader
Spark之Shuffle机制和原理+源码解析_第9张图片
采用BlockStoreShuffleReader的方式读取数据

你可能感兴趣的:(spark)