Hive SQL中join的使用

Hive SQL中的join有以下几种常用的方式:


1.left (outer) join,以join的左边表为基础输出,在结果表中满足on的条件的记录中增加右边表的字段值,以上图左一所示:    

2. right (outer) join, 以join的右边表为基础输出,在结果表中满足on的条件的记录中增加左边表的字段值,以上图右一所示:

3.(inner) join, 结果表输出同时满足on的条件的记录及A.B字段,如中间图所示。

4.cross join, 即笛卡尔积,一般不怎么用。

上图中其他场景均为使用where选择之后的应用,本处不做讨论,在使用join的过程中需要注意由于重复记录或者多条记录满足表的join的条件所导致的数据膨胀问题。




   

你可能感兴趣的:(推荐系统)