我们在进行字符串比对和处理的时候;可能用得最多是like子句;其中%代表一个到多个字符;_代表一个字符。但是处理比较复杂字符串时;发现这远远达不到我们所需的要求。所以这种低端,不美观的语句。当然我们也不抛弃它们;毕竟oracle都没放弃他们。在Oracle10g后,提供了若干与正则表达式相关的函数和操作。用好这些函数,可以大大提升我们的处理字符串的能力和水平。
10g版本有4个正则函数,regexp_like,regexp_insrt,regexp_replace,regexp_substr。
11g版本添加了:regexp_count。
先看下这个表;一切变换都在此表;这表就是正则的心法。
元字符 | 意思 | 例子 |
\ | 说明要匹配的字符是一个特殊字符、常量或者后者引用。(后引用重复上一次的匹配) |
\n 匹配换行符 \\ 匹配 \ \( 匹配 ( \) 匹配 ) |
^ | 匹配字符串的开头位置 | ^a匹配arwen.但不匹配barwen. |
$ | 匹配字符串的末尾位置 | en$匹配arwen.但不匹配arwenb. |
* | 匹配前面的字符0次或多次 | a*rwen可以匹配rwen或aaarwen. |
+ | 匹配前面的字符1次或多次 | a+rwen可以匹配arwen或aarwen.但不能匹配rwen. |
? | 匹配前面的字符0次或1次 | a?rwen可以匹配arwen或rwen.但不能匹配aarwen. |
{n} | 匹配前面的字符恰好是n次,其中n是整数 | ar{2}wen可以匹配arrwen.但不能匹配arwen或arrrwen. |
{n,m} | 匹配前面的字符至少是n次,最多是m次.如果写成 {n,}表示最少匹配n次.没有上限. |
ar{1,2}wen可以匹配arwen,arrwen.但不匹配awen或arrrwen. |
. | 点号,匹配除null,换行以外的任意单个字符 | arw.n.可以匹配arwen,arwin.但不能匹配arween或arwn. |
(pattern) | 括号中pattern是一个子正则表达式,匹配指定pattern模式的一个子表达式。 | 其实括号就像一般语言表达式中的括号.有时多加些括号可增强可读性.另外的用处见下面关于\n的描述. |
x|y | 匹配“或” | x|y可以匹配x或者y |
[abc] | 可以匹配abc中的任何单个字符 | hello[abc]可以匹配helloa,hellob,helloc |
[a-z] | 可以匹配指定范围内的任何单个字符 | hell[a-z]可以匹配hello或者hellz |
[::] | 指定一个字符类,可以匹配该类中的任何字符 | [:alphanum:]可以匹配字符0-9、A-Z、a-z [:alpha:]可以匹配字符A-Z、a-z [:blank:]可以匹配空格或tab键 [:digit:]可以匹配数字0-9 [:graph:]可以匹配非空字符 [:lower:]可以匹配小写字母a-z [:print:]与[:graph:]类似,不同之处在于[:print:]包括空格字符 [:punct:]可以匹配标点符号.,""等等 [:space:]可以匹配所有的空字符 [:upper:]可以匹配大写字母A-Z [:xdigit:]可以匹配十六进制数字0-9、A-F、a-f |
\n | 这是对前一次匹配命中的一个后引用,其中n是一个正整数 | arw(en)\1可以匹配arwenen.注意\1前面必须是个加括号的子表达式. |
先提供一个事例表regexp_li0924来供我们练习:
CREATE TABLE regexp_li0924( text VARCHAR(20) ); INSERT INTO regexp_li0924 VALUES ('123'); INSERT INTO regexp_li0924 VALUES ('123a'); INSERT INTO regexp_li0924 VALUES ('123123?'); INSERT INTO regexp_li0924 VALUES ('afefwef'); INSERT INTO regexp_li0924 VALUES ('?'); INSERT INTO regexp_li0924 VALUES ('AFWEWE'); INSERT INTO regexp_li0924 VALUES ('1_2_3'); INSERT INTO regexp_li0924 VALUES ('1fe_24563');
1. REGEXP_LIKE函数
regexp_like(srcstr,pattern[,match_option]): 查看srcstr是否与pattern相匹配,返回布尔值;该函数还可以提供一个可选的参数match_option字符串说明默认的匹配选项。其中match_option所选如下:
'c' 说明在进行匹配时区分大小写(缺省值);
'i' 说明在进行匹配时不区分大小写;
'n' (.)点号能表示所有单个字符,包括换行(俺还不知道什么地方有用到换行.只知道sql里面可以用chr(10)表示换行.
'm' 字符串存在换行的时候当作多行处理.这样$就可匹配每行的结尾.不然的话$只匹配字符串最后的位置.
举例说明:
--查询里面含有数字的 SELECT * FROM regexp_li0924 WHERE regexp_like(text,'[[:digit:]]'); --查询里面含有数?的 SELECT * FROM regexp_li0924 WHERE regexp_like(text,'\?'); --查询含有'a' SELECT * FROM regexp_li0924 WHERE regexp_like(text,'a'); --查询'a'或者'A' SELECT * FROM regexp_li0924 WHERE regexp_like(text,'a','i'); --可能大家会想到这种。其实正则是多变的。于是有了第二种方法。 SELECT * FROM regexp_li0924 WHERE regexp_like(text,'(a|A)');
2. REGEXP_INSTR函数
REGEXP_INSTR(srcstr,pattern[,start[,occurrence[,return_option[, match_option]]]]):这个函数参数就比较多了;是基本SQL函数INSTR的一种拓展。Instr函数的作用是返回一个整数,表示一个字符串中第一次出现匹配字符串的位置编号。
至于参数就参考INSTR函数
我们用事例来解释:我基本没用到过这个函数
select regexp_instr(text,'[^[:digit:]]'),text from regexp_li0924; --这样也是一种查非数字的方法 --从字符串'f2345ef4a56'第2个字符开始,查找zip中第3个非数字字符的位置 select regexp_instr('f2345ef456','[^[:digit:]]',2,3) from dual --返回7 --从字符串'f2345ef4a56'第2个字符开始,查找zip中第3个非数字字符的下2个字符位置 select regexp_instr('f2345ef456','[^[:digit:]]',2,2,1) from dual;
3. REGEXP_REPLACE函数
REGEXP_REPLACE(srcstr,pattern[,replace_string[,start[,occurrence[, match_option]]]]);这个函数也相当于replace函数的扩展。返回是替换后的字符串。
参数跟上面差不多
--截取类似于字符串123_1563中的123 SELECT regexp_replace('123_1563','(.*)_(.*)','\1') FROM dual; SELECT regexp_replace('123_1563','_[[:digit:]]+','') FROM dual; --把字符串'123456fewfwefe34165'替换为0的字符串 SELECT regexp_replace('123456fewfwefe34165','[^[:digit:]]','0') FROM dual; --把姓与名互相替换位置(因为英语名跟中文名是不一样的。) SELECT regexp_replace('mei han','(.*) (.*)','\2 \1' ) FROM dual;
4. REGEXP_SUBSTR函数
REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])用于在x中查找pattern并返回.这个函数我比较喜欢.因为很好用.这个在字符串分割中很受用.可以查看我的--sql中的字符分割.
--把字符串MMS-2501-MO取其中的2501.当然regexp_replace就可以搞定了。但我还是喜欢这种 SELECT regexp_substr('MMS_2501_MO','[^_]+',1,2) FROM dual;
5.REGEXP_COUNT函数
REGEXP_COUNT(srcstr,pattern[,match_option])用于返回匹配到的个数.oracle11g才支持
--例如取某个字符串中含有多少个0.这个当然你可以数数;但是你回去数吗?也当然可以不用正则函数;你用了这个函数,会不会有高大上 SELECT regexp_substr('12308045600460','0') FROM dual;
作者 : li0924
时间 : 2014-11-04
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接.