spark血统--宽窄依赖(史上最简单的解释)

Wide Dependencies (宽依赖):是指子RDD的分区依赖于父RDD的多个分区或所有分区(子rdd和父rdd的关系是一对多的关系)

Narrow Dependencies(窄依赖):是指父RDD的每一个分区最多被一个子RDD的分区所用(一个子rdd和父rdd的关系理想情况下是一对一)

spark血统--宽窄依赖(史上最简单的解释)_第1张图片

 

spark血统--宽窄依赖(史上最简单的解释)_第2张图片

 

你可能感兴趣的:(spark)