hive实现行转列的方法及concat concat_ws collect_set的用法

如对以下原数据进行分析,把不同的订单类型的数量按照每个用户一行进行展示:

user type number
user1 delivered 10
user2 returned 1
user1 returned 3
user2 delivered 20
目标:
user order
user1 delivered(10),returned(3)
user2 delivered(20),returned(1)

1.使用concat()函数将type和number连接起来

concat(order_type,’(’,order_number,’)’)

user order
user1 delivered(10)
user2 returned(1)
user1 returned(3)
user2 delivered(20)
2.使用concat_ws()和collect_set()进行合并行
将上面列表中一个user可能会占用多行转换为每个user占一行的目标表格式,实际是“列转行”

select user,concat_ws(’,’,collect_set(concat(order_type,’(’,order_number,’)’))) t from table group by user
(t是别名)
concat_ws()会以括号中的第一个参数为分隔符把后面的参数值进行拼接。
collect_set()会对group by 后面的参数进行去重对group by以后属于同一user的形成一个集合,结合concat_ws对集合中元素使用,进行分隔形成字符串

你可能感兴趣的:(hive)