Spark入门(七)--Spark的intersection、subtract、union和distinc
Spark的intersectionintersection顾名思义,他是指交叉的。当两个RDD进行intersection后,将保留两者共有的。因此对于RDD1.intersection(RDD2)和RDD2.intersection(RDD1)。应该是一致的。比如对于,List1={1,2,3,4,5}和List1={3,4,5,6,7},对于包含这两个List的RDD来说,他们进行一次int