Impala & Hive 保留中文字符

先放impala的:

select
city
from 表名
where ds >= %start_date%
and ds <= %end_date%
and REGEXP_LIKE(city,'^[\u4e00-\u9fa5]*$')
字符 说明
\u4e00-\u9fa5 汉字的unicode范围
\u0030-\u0039 数字的unicode范围
\u0041-\u005a 大写字母unicode范围
\u0061-\u007a 小写字母unicode范围

注意:
数字 和 字母可以不使用上面提供的unicode码来分辨, 而使用下面的方式 (其实都是一样的):

^[\u4e00-\u9fa5_a-zA-Z0-9]+$

你可能感兴趣的:(03,Hive及数仓)