hive 中的正则表达式(筛选车牌号)

* 和+ 的区别

* 是0次或多次
+ 是一次或多次

匹配 车牌号

开头是汉字,中间是任意字符,结尾是汉字 或者 是任意字符
select * from jt where hphm rlike '^[\\\u4e00-\\\u9fa5]\\w+[\\\u4e00-\\\u9fa5]|[\\\u4e00-\\\u9fa5]\\w+$';

**如果是一下这种情况,车牌号是 沪BA306警 这种的就会被过滤掉 (会过滤掉结尾是汉字的车牌号) **
select * from jt where hphm rlike '[\\\u4e00-\\\u9fa5]\\w*$';

你可能感兴趣的:(#,新增知识,大数据,hive,正则表达式)