158、Spark内核原理进阶之sortByKey算子内部实现原理

sortByKey.png

sortByKey

  1. ShuffledRDD,做shuffle read,将相同的key拉到一个partition中来
  2. mapPartitions,对每个partitions内的key进行全局的排序

你可能感兴趣的:(158、Spark内核原理进阶之sortByKey算子内部实现原理)