hive-sql截取汉字、字母和数字等

前几天新接到需求,要求截取字段里的汉字,截取字母、数字、特殊字符都简单,但是截取汉字的还是第一次遇见,查到汉字的编码,实验截取,在这里把代码发下,以备有需要的小伙伴使用。
在查询字段中截取汉字、字母和数字等代码如下:

regexp_extract(label,'([\\u4E00-\\u9FA5]+)',1)      windows下的截取汉字

regexp_extract(label,'([\\\u4E00-\\\u9FA5]+)',1)    linux下的截取汉字(比windows下多了一个转义符\)

regexp_extract(label,'([a-zA-Z0-9]+)',1)            截取字母和数字

select regexp_replace("2018-09-12",'-',"")          指定字符串的替换或删除(日期格式转换 20180912)注:hive里replace不可用

你可能感兴趣的:(hive学习)