spark连接操作

将有键的数据与另一组有键的数据一起使用是对键值对数据执行的最有用的操作之一。连接数据可能是PairRDD最常用的操作之一。连接的方式多种多样:右外连接,左外连接、交叉连接以及内连接

普通的join操作符表示是内连接。只有在两个键值对中都存在的键才叫输出。

你可能感兴趣的:(spark连接操作)