RDD 中transformation的groupBy,partitionBy,cogroup详解--(视频笔记)

groupBy

针对key进行分组操作。

partitionBy
原有partitioner和现在partitioner不同才触发重新分片,如果一直则不会触发
一般都是根据key进行分片的。

cogroup
协同,针对两个RDD进行协同划分
返回的结果,key-value value为两个数据的集合的迭代器。

你可能感兴趣的:(RDD 中transformation的groupBy,partitionBy,cogroup详解--(视频笔记))