hive中的concat,concat_ws,collect_set用法

需求:对用户的订单进行分析,将不同订单类型分别多少单展示出来,每个用户一行

原数据:

user order_type order_number
user1 delivered 10
user2 returned 1
user1 returned 3
user2 delivered 20
目标:

user order
user1 delivered(10),returned(3)
user2 delivered(20),returned(1)

1.使用concat()函数将order_type和order_number连接起来

concat(order_type,'(',order_number,')')

user order
user1 delivered(10)
user2 returned(1)
user1 returned(3)
user2 delivered(20)
2.使用concat_ws()和collect_set()进行合并行

将上面列表中一个user可能会占用多行转换为每个user占一行的目标表格式,实际是“列转行”

select user,concat_ws(',',collect_set(concat(order_type,'(',order_number,')')))  order from table group by user

order是别名

collect_set的作用:

(1)去重,对group by后面的user进行去重

(2)对group by以后属于同一user的形成一个集合,结合concat_ws对集合中元素使用,进行分隔形成字符串

你可能感兴趣的:(hive)