将多行记录合并为一条:concat_ws ,collect_set;将多个字段合并为一个:coalesce

1、多列合并为一列
COALESCE(expression_1, expression_2, …,expression_n)
依次参考各参数表达式,遇到非null值即停止并返回该值。如果所有的表达式都是空值,最终将返回一个空值。使用COALESCE在于大部分包含空值的表达式最终将返回空值。
2、多行合并为一行
分层级取数:投诉工单>通信质量>无法正常使用数据业务>无法上网/掉线>固网>宽带故障
sselect a.row_id,concat_ws(’>’, collect_set(b.code_name)) code_name
from (select row_id, id_list
from open_038_dim.dim_ivr_path LATERAL VIEW explode(split(path, ‘,’)) aa as id_list) a
left join open_038_dim.dim_ivr_path b on a.id_list=b.row_id
group by a.row_id

这里的collect_set的作用是对promotion_id去重

知识点:

一、concat()函数可以连接一个或者多个字符串

CONCAT(str1,str2,…) 返回结果为连接参数产生的字符串。如有任何一个参数为NULL ,则返回值为 NULL。

select concat(‘11’,‘22’,‘33’); 112233

二、CONCAT_WS(separator,str1,str2,…)

是CONCAT()的特殊形式。第一个参数是其它参数的分隔符。分隔符的位置放在要连接的两个字符串之间。分隔符可以是一个字符串,也可以是其它参数。

select concat_ws(’,’,‘11’,‘22’,‘33’);  11,22,33

三、group_concat()分组拼接函数

group_concat([DISTINCT] 要连接的字段 [Order BY ASC/DESC 排序字段] [Separator ‘分隔符’])

对下面的一组数据使用 group_concat()

| id |name

|1 | 10|
  |1 | 20|
  |1 | 20|
  |2 | 20|
  |3 | 200 |
  |3 | 500 |

1、select id,group_concat(name) from aa group by id;

|1 | 10,20,20|
  |2 | 20 |
  |3 | 200,500|

2、select id,group_concat(name separator ‘;’) from aa group by id;

|1 | 10;20;20 |
  |2 | 20|
  |3 | 200;500 |

3、select id,group_concat(name order by name desc) from aa group by id;

|1 | 20,20,10 |
  |2 | 20|
  |3 | 500,200|

4、select id,group_concat(distinct name) from aa group by id;

|1 | 10,20|
  |2 | 20 |
 |3|200,500|

原文:https://blog.csdn.net/lh0912666/article/details/81024275

你可能感兴趣的:(Hive,SQL)