HIVE中regexp_extract用法

select province_name,regexp_extract(province_name,'(.+)(市)',1) 
from areas limit 10;
+----------------+------+--+
| province_name  | _c1  |
+----------------+------+--+
| 北京市            | 北京  |
| 北京市            | 北京  |

函数描述:

regexp_extract(str, regexp[, idx]) - extracts a group that matches regexp

字符串正则表达式解析函数。-- 这个函数有点类似于 substring(str from 'regexp') ..

参数解释:
其中:
str是被解析的字符串
regexp 是正则表达式
idx是返回结果 取表达式的哪一部分 默认值为1。
0表示把整个正则表达式对应的结果全部返回
1表示返回正则表达式中第一个() 对应的结果 以此类推
注意点:
要注意的是idx的数字不能大于表达式中()的个数。
否则报错。

你可能感兴趣的:(HIVE中regexp_extract用法)