HIVE SQL使用regexp_replace正则替换敏感身份证信息

有一张信息表,如下图所示,其中包含了个人的身份证信息,根据监管需求,输出时,需对敏感身份证信息做模糊处理。
HIVE SQL使用regexp_replace正则替换敏感身份证信息_第1张图片
我们知道身份证号有两种组成情况:
1.18位阿拉伯数字;
2.17位阿拉伯数字+1位拉丁字母;
可以通过正则表达式表示以上两种组合,1对应的pattern为[0-9]{18},2对应的pattern为[0-9]{17}[A-Za-z]{1}
然后使用regexp_replace函数将以上两种组合替换为***********模糊输出。

select
id
,name
,case when trim(COALESCE(regexp_extract(id_number,'([0-9]{18}|[0-9]{17}[A-Za-z]{1})',1),''))<>''
then regexp_replace(id_number,'([0-9]{18}|[0-9]{17}[A-Za-z]{1})','***********')
else id_number
end as id_number
from table_name
where id_number regexp '[0-9]{18}|[0-9]{17}[A-Za-z]{1}'

你可能感兴趣的:(SQL,正则表达式,HIVE,hive,hadoop,数据仓库,正则表达式)