hive字符串拼接常用方法

hive中常用的一些拼接函数

1.  concat()      实现把若干个字段(字段类型可不相同)数据拼接起来

用法: concat(string a1, int a2, float a3)
select concat("aa", 11, 2.2);
aa112.2

不同字段之间用分隔符连接("_")
select concat("aa","_",11,"_",2.2);
aa_11_2.2

举例:计算各个类别占比

select sourcetype
,concat(round(count(1)*100.0/total,2),"%") as rate
from table
group by sourcetype;


2.  concat_ws()   使用分隔符将若干个字符串拼接起来,实现列转行

用法: 其第一个参数是分隔符,第二个及之后的参数是待拼接数据,
类型 must be "string or array"。
1. concat_ws(seperator, string s1, string s2,...)

select concat_ws("_","aa",string(11),string(2.2));
aa_11_2.2

2.常常结合group by与collect_set,collect_list使用

表数据为
id    score
11    100
11    80
22    90
22    80
22    70
select id
,concat_ws("_", collect_list(cast(score as string)))
from table 
group by id;

11 100_80
22 90_80_70

cast(value as type)     将某个列的值显示的转化为某个类型
例子:cast(score as string ) 将int类型的数据转化为了String类型

collect_set()    与group by结合,将一个字段元素形成一个集合(元素自动去重),

与contact_ws结合使用就是将这些元素以指定分隔符拼接成成字符串。

collect_list()     与collect_set() 功能类似,但不会对元素去重。

你可能感兴趣的:(hive,hive)