hive中文匹配之正则表达式

1、regexp
语法:A regexp B
返回值:string
说明:功能与rlike类似
2、regexp_extract
语法:regexp extract(string subject,string pattern,int index)
返回值:string
说明:将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符,即第一参数:要处理的字段,第二参数需要匹配的正则表达式,第三个参数:0是显示与之匹配的整个字符串,1,是显示第一个括号里面的,2是显示第二个括号里面的字段
例如:
在这里插入图片描述
hive中文匹配之正则表达式_第1张图片
hive中文匹配之正则表达式_第2张图片
3、regexp_replace
语法:regexp_replace(string A,string B,string C)
返回值:string
说明:将字符串A中的符合正则表达式B的部分替换为C
hive中文匹配之正则表达式_第3张图片
hive中文匹配之正则表达式_第4张图片
在这里插入图片描述

另: substr(substring)函数也可以模糊截取字符串但只能是固定位置
语法:substr(string A, int start,len)
返回值:string
说明:返回字符串A从start位置到len长度的字符串
在这里插入图片描述
返回:llo
在这里插入图片描述
返回:o
在这里插入图片描述
返回:ll
在这里插入图片描述
返回值一样:he(都是从第一个位置开始取值)

参考文章:
https://blog.csdn.net/lovebyz/article/details/52485065
https://blog.csdn.net/jv_rookie/article/details/55211955

你可能感兴趣的:(数据库)