hive切分字段,hive函数:正则函数regexp_replace

SELECT
case when length(split_part(regexp_replace(txtlg,’’,’-’),’-’,4))>0 then split_part(regexp_replace(txtlg,’’,’-’),’-’,4)
when length(split_part(regexp_replace(txtlg,’’,’-’),’-’,3))>0 then split_part(regexp_replace(txtlg,’’,’-’),’-’,3)
when length(split_part(regexp_replace(txtlg,’’,’-’),’-’,2))>0 then split_part(regexp_replace(txtlg,’’,’-’),’-’,2)
when length(split_part(regexp_replace(txtlg,’’,’-’),’-’,1))>0 then split_part(regexp_replace(txtlg,’’,’-’),’-’,1)
end as txtlg
from stg.stg_tf3ddnsh
说明:txtlg(字段名)数据样子为:AA_BBB-C-DD
stg.stg_tf3ddnsh(数据库名.表名)
那么, length(split_part(regexp_replace(txtlg,’’,’-’),’-’,4))>0 的意思是:把AA_BBB-C-DD中的‘’用‘-’替换,然后以‘-’为标识分段,如果第4段有内容,即 length()>0 ,那么执行split_part(regexp_replace(txtlg,’_’,’-’),’-’,4),也就是现实第4段的内容,regexp_replace为替换的意思,
返回的结果应为 DD。

你可能感兴趣的:(程序媛,好用的东西,原创作者)