Hive 行转列,列传行 - Impala 暂不支持

注:Impala 不支持 lateral view explode 

一、行转列 (对某列拆分,一列拆多行)

使用函数:lateral view explode(split(column, ',')) num

eg: 如表:t_row_to_column_tmp 数据如下,对tag列进行拆分

Hive 行转列,列传行 - Impala 暂不支持_第1张图片

SQL代码:

select id,tag,tag_new

  from t_row_to_column_tmp

lateral view explode(split(tag, ',')) num as tag_new

where id=212022894;

Hive 行转列,列传行 - Impala 暂不支持_第2张图片

 

二、列转行 (根据主键,进行多行合并一列)

使用函数:concat_ws(',',collect_set(column))  

说明:collect_list 不去重,collect_set 去重。 column 的数据类型要求是 string

eg:如表:t_column_to_row ,根据id,对tag_new 进行合并

Hive 行转列,列传行 - Impala 暂不支持_第3张图片

 

SQL代码1:

select id,

         concat_ws(',',collect_set(tag_new)) as tag_col

 from t_column_to_row

group by id;

Hive 行转列,列传行 - Impala 暂不支持_第4张图片

 

SQL代码2:

select id,

         concat_ws(',',collect_list(tag_new)) as tag_col

 from t_column_to_row

group by id;

Hive 行转列,列传行 - Impala 暂不支持_第5张图片

 

参考:https://www.cnblogs.com/kimbo/p/6208973.html

你可能感兴趣的:(Hive,Hadoop生态系统个人总结)