oracle高级SQL(一)--正则函数详解

    我们在进行字符串比对和处理的时候;可能用得最多是like子句;其中%代表一个到多个字符;_代表一个字符。但是处理比较复杂字符串时;发现这远远达不到我们所需的要求。所以这种低端,不美观的语句。当然我们也不抛弃它们;毕竟oracle都没放弃他们。在Oracle10g后,提供了若干与正则表达式相关的函数和操作。用好这些函数,可以大大提升我们的处理字符串的能力和水平。

   10g版本有4个正则函数,regexp_like,regexp_insrt,regexp_replace,regexp_substr。
   11g版本添加了:regexp_count。

  先看下这个表;一切变换都在此表;这表就是正则的心法。

元字符 意思 例子
    \

说明要匹配的字符是一个特殊字符、常量或者后者引用。(后引用重复上一次的匹配)

\n 匹配换行符
\\ 匹配 \
\( 匹配 (
\) 匹配 )
^ 匹配字符串的开头位置 ^a匹配arwen.但不匹配barwen.
     $ 匹配字符串的末尾位置 en$匹配arwen.但不匹配arwenb.
      * 匹配前面的字符0次或多次 a*rwen可以匹配rwen或aaarwen.
+ 匹配前面的字符1次或多次 a+rwen可以匹配arwen或aarwen.但不能匹配rwen.
? 匹配前面的字符0次或1次 a?rwen可以匹配arwen或rwen.但不能匹配aarwen.
{n} 匹配前面的字符恰好是n次,其中n是整数 ar{2}wen可以匹配arrwen.但不能匹配arwen或arrrwen.
{n,m}

匹配前面的字符至少是n次,最多是m次.如果写成

{n,}表示最少匹配n次.没有上限.

ar{1,2}wen可以匹配arwen,arrwen.但不匹配awen或arrrwen.
. 点号,匹配除null,换行以外的任意单个字符 arw.n.可以匹配arwen,arwin.但不能匹配arween或arwn.
(pattern) 括号中pattern是一个子正则表达式,匹配指定pattern模式的一个子表达式。 其实括号就像一般语言表达式中的括号.有时多加些括号可增强可读性.另外的用处见下面关于\n的描述.
x|y 匹配“或” x|y可以匹配x或者y
[abc] 可以匹配abc中的任何单个字符 hello[abc]可以匹配helloa,hellob,helloc
[a-z] 可以匹配指定范围内的任何单个字符 hell[a-z]可以匹配hello或者hellz
[::] 指定一个字符类,可以匹配该类中的任何字符 [:alphanum:]可以匹配字符0-9、A-Z、a-z
[:alpha:]可以匹配字符A-Z、a-z
[:blank:]可以匹配空格或tab键
[:digit:]可以匹配数字0-9
[:graph:]可以匹配非空字符
[:lower:]可以匹配小写字母a-z
[:print:]与[:graph:]类似,不同之处在于[:print:]包括空格字符
[:punct:]可以匹配标点符号.,""等等
[:space:]可以匹配所有的空字符
[:upper:]可以匹配大写字母A-Z
[:xdigit:]可以匹配十六进制数字0-9、A-F、a-f
\n 这是对前一次匹配命中的一个后引用,其中n是一个正整数 arw(en)\1可以匹配arwenen.注意\1前面必须是个加括号的子表达式.

 

先提供一个事例表regexp_li0924来供我们练习:

 CREATE TABLE regexp_li0924(

 text VARCHAR(20)

);

INSERT INTO regexp_li0924 VALUES ('123');

INSERT INTO regexp_li0924 VALUES ('123a');

INSERT INTO regexp_li0924 VALUES ('123123?');

INSERT INTO regexp_li0924 VALUES ('afefwef');

INSERT INTO regexp_li0924 VALUES ('?');

INSERT INTO regexp_li0924 VALUES ('AFWEWE');

INSERT INTO regexp_li0924 VALUES ('1_2_3');

INSERT INTO regexp_li0924 VALUES ('1fe_24563');

   1. REGEXP_LIKE函数


     regexp_like(srcstr,pattern[,match_option]): 查看srcstr是否与pattern相匹配,返回布尔值;该函数还可以提供一个可选的参数match_option字符串说明默认的匹配选项。其中match_option所选如下:
   'c'   说明在进行匹配时区分大小写(缺省值);
   'i'   说明在进行匹配时不区分大小写;
   'n'   (.)点号能表示所有单个字符,包括换行(俺还不知道什么地方有用到换行.只知道sql里面可以用chr(10)表示换行.
   'm'   字符串存在换行的时候当作多行处理.这样$就可匹配每行的结尾.不然的话$只匹配字符串最后的位置.
   举例说明:

--查询里面含有数字的

SELECT * FROM regexp_li0924 WHERE regexp_like(text,'[[:digit:]]');

--查询里面含有数?的

SELECT * FROM regexp_li0924 WHERE regexp_like(text,'\?'); 

--查询含有'a'

SELECT * FROM regexp_li0924 WHERE regexp_like(text,'a'); 

--查询'a'或者'A'

SELECT * FROM regexp_li0924 WHERE regexp_like(text,'a','i');  --可能大家会想到这种。其实正则是多变的。于是有了第二种方法。

SELECT * FROM regexp_li0924 WHERE regexp_like(text,'(a|A)');

 

   2. REGEXP_INSTR函数


  REGEXP_INSTR(srcstr,pattern[,start[,occurrence[,return_option[, match_option]]]]):这个函数参数就比较多了;是基本SQL函数INSTR的一种拓展。Instr函数的作用是返回一个整数,表示一个字符串中第一次出现匹配字符串的位置编号。
至于参数就参考INSTR函数
我们用事例来解释:我基本没用到过这个函数

select regexp_instr(text,'[^[:digit:]]'),text from regexp_li0924; --这样也是一种查非数字的方法

--从字符串'f2345ef4a56'第2个字符开始,查找zip中第3个非数字字符的位置

select regexp_instr('f2345ef456','[^[:digit:]]',2,3) from dual  --返回7

--从字符串'f2345ef4a56'第2个字符开始,查找zip中第3个非数字字符的下2个字符位置

select regexp_instr('f2345ef456','[^[:digit:]]',2,2,1) from dual;

 

   3. REGEXP_REPLACE函数


REGEXP_REPLACE(srcstr,pattern[,replace_string[,start[,occurrence[, match_option]]]]);这个函数也相当于replace函数的扩展。返回是替换后的字符串。
参数跟上面差不多

--截取类似于字符串123_1563中的123

SELECT regexp_replace('123_1563','(.*)_(.*)','\1') FROM dual;

SELECT regexp_replace('123_1563','_[[:digit:]]+','') FROM dual;

--把字符串'123456fewfwefe34165'替换为0的字符串

SELECT regexp_replace('123456fewfwefe34165','[^[:digit:]]','0') FROM dual;

--把姓与名互相替换位置(因为英语名跟中文名是不一样的。)

SELECT regexp_replace('mei han','(.*) (.*)','\2 \1' ) FROM dual;

  

   4. REGEXP_SUBSTR函数


  REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])用于在x中查找pattern并返回.这个函数我比较喜欢.因为很好用.这个在字符串分割中很受用.可以查看我的--sql中的字符分割.

--把字符串MMS-2501-MO取其中的2501.当然regexp_replace就可以搞定了。但我还是喜欢这种

SELECT regexp_substr('MMS_2501_MO','[^_]+',1,2) FROM dual;

 

   5.REGEXP_COUNT函数


   REGEXP_COUNT(srcstr,pattern[,match_option])用于返回匹配到的个数.oracle11g才支持

--例如取某个字符串中含有多少个0.这个当然你可以数数;但是你回去数吗?也当然可以不用正则函数;你用了这个函数,会不会有高大上

SELECT regexp_substr('12308045600460','0') FROM dual;

 

作者 : li0924

时间 : 2014-11-04

本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接.

你可能感兴趣的:(oracle)