Oracle正则表达式函数

Oracle正则表达式函数

     1、正则表达式中的元字符

元字符
意思
例子
\
说明要匹配的字符是一个特殊字符、常量或者后者引用。(后引用重复上一次的匹配) \n 匹配换行符
           \\ 匹配 \
           \( 匹配 (
           \) 匹配 )
^ 匹配字符串的开头位置 如果A是字符串的第一个字符,^A 匹配 A
$
匹配字符串的末尾位置 如果B是字符串的最后一个字符,$B 匹配 B
*
匹配前面的字符0次或多次 ba*rk可以匹配 brk、bark、baark等等
+ 匹配前面的字符1次或多次 ba+rk可以匹配 bark、baark等等,但是不能匹配brk,也就是说,最少有以一次。
? 匹配前面的字符0次或1次 ba?rk可以匹配 bark、brk等等,但是不能匹配baark。
{n} 匹配前面的字符恰好是n次,其中n是整数 hob{2}it可以匹配hobbit
{n,m} 匹配前面的字符至少是n次,最多是m次,其中n,m都是整数 hob{2,3}it可以匹配hobbit或者hobbbit
. 匹配除null以外的任意单个字符 hob.it中的.可以是任意的单个字符,如:hobsit等等
(pattern) 括号中pattern是一个子正则表达式,匹配指定pattern模式的一个子表达式。 如:aaa(x|y)可以匹配aaax或者aaay。
x|y 匹配“或” x|y可以匹配x或者y
[abc] 可以匹配abc中的任何单个字符 hello[abc]可以匹配helloa,hellob,helloc
[a-z] 可以匹配指定范围内的任何单个字符 hell[a-z]可以匹配hello或者hellz
[::] 指定一个字符类,可以匹配该类中的任何字符 [:alphanum:]可以匹配字符0-9、A-Z、a-z
           [:alpha:]可以匹配字符A-Z、a-z
           [:blank:]可以匹配空格或tab键
           [:digit:]可以匹配数字0-9
           [:graph:]可以匹配非空字符
           [:lower:]可以匹配小写字母a-z
           [:print:]与[:graph:]类似,不同之处在于[:print:]包括空格字符
           [:punct:]可以匹配标点符号.,""等等
           [:space:]可以匹配所有的空字符
           [:upper:]可以匹配大写字母A-Z
           [:xdigit:]可以匹配十六进制数字0-9、A-F、a-f
\n 这是对前一次匹配命中的一个后引用,其中n是一个正整数 (.)\1可以匹配两个连续相同的非空字符。(.)可以匹配除null以外的任何单个字符,而\1则重复上一次匹配的内容,即再次匹配相同的字符,因此可以匹配两个连续相同的非空字符


2、REGEXP_LIKE(x,pattern[,match_option])用于在x中查找正则表达式pattern,该函数还可以提供一个可选的参数match_option字符串说明默认的匹配选项。match_option的取值如下:
‘c’    说明在进行匹配时区分大小写(缺省值);
 'i'    说明在进行匹配时不区分大小写;
 'n'    允许使用可以匹配任意字符的操作符;
 'm'    将x作为一个包含多行的字符串。

DECLARE
    V_FIRST_NAME VARCHAR2(50);
    V_DOB DATE;
BEGIN
    --返回1965-1968你出生的FIRST_NAME以‘J’开头的消费者
    SELECT FIRST_NAME,DOB INTO V_FIRST_NAME,V_DOB
    FROM CUSTOMERS
    WHERE REGEXP_LIKE(TO_CHAR(DOB,'YYYY'),'^196[5-8]$') AND REGEXP_LIKE(FIRST_NAME,'^J');
                                                                                                     
    DBMS_OUTPUT.PUT_LINE(V_FIRST_NAME);
                                                                                                     
END;



3、REGEXP_INSTR(x,pattern[,start[,occurrence[,return_option[, match_option]]]])用于在x中查找pattern。返回pattern在x中出现的位置。匹配位置从1开始。可以参考字符串函数 INSTR(),参数相关:
   'start'    开始查找的位置;
   'occurrence'    说明应该返回第几次出现pattern的位置;
   'eturn_option'    说明应该返回什么整数。若该参数为0,则说明要返回的整数是x中的一个字符的位置;若该参数为非0的整数,则说明要返回的整数为x中出现在pattern之后的字符的位置;
   'match_option'    修改默认的匹配设置。

DECLARE
    V_RESULT INTEGER;
BEGIN
    --返回17,找出l开头的 后跟4个任意字母的单词在第一个参数中第一次出现的位置,这里是light中l的位置
    SELECT REGEXP_INSTR('But, soft! What light through yonder window breaks?','l[[:alpha:]]{4}',1,1,0) INTO V_RESULT
    FROM DUAL;
                                                                                                 
    DBMS_OUTPUT.PUT_LINE(V_RESULT);
                                                                                                 
    --返回22,找出l开头的 后跟4个任意字母的单词在第一个参数中第一次出现的位置,这里是light中t的位置+1
    SELECT REGEXP_INSTR('But, soft! What light through yonder window breaks?','l[[:alpha:]]{4}',1,1,1) INTO V_RESULT
    FROM DUAL;
                                                                                                 
    DBMS_OUTPUT.PUT_LINE(V_RESULT);
END;


4、REGEXP_REPLACE(x,pattern[,replace_string[,start[,occurrence[, match_option]]]])用于在x中查找pattern,并将其替换为replae_string。可以参考字符串函数 REPLACE(),参数同REGEXP_INSTR函数,参考第3

DECLARE
    V_RESULT VARCHAR2(255);
BEGIN
--返回But, soft! What XXX through yonder window breaks? 用‘XXX’代替‘light’
SELECT REGEXP_REPLACE('But, soft! What light through yonder window breaks?','l[[:alpha:]]{4}','XXX') INTO V_RESULT
FROM DUAL;     
    DBMS_OUTPUT.PUT_LINE(V_RESULT);    
END;


5、REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])用于在x中查找pattern并返回。可以参考字符串函数 SUBSTR(),参数同REGEXP_INSTR函数,参考第3

DECLARE
    V_RESULT VARCHAR2(255);
BEGIN
--返回‘light’
SELECT REGEXP_SUBSTR('But, soft! What light through yonder window breaks?','l[[:alpha:]]{4}') INTO V_RESULT
FROM DUAL;     
    DBMS_OUTPUT.PUT_LINE(V_RESULT);    
END;


http://kt8668.iteye.com/blog/122001


补:

http://docs.oracle.com/cd/B12037_01/server.101/b10759/functions115.htm


SELECT phone_number,
       REGEXP_REPLACE(phone_number,
                      '([[:digit:]]{3})\.([[:digit:]]{3})\.([[:digit:]]{4})',
                      '(\1) \2-\3') "REGEXP_REPLACE"
  FROM employees;


PHONE_NUMBER         REGEXP_REPLACE
-------------------- --------------------------------------------------------------------------------
650.507.9833         (650) 507-9833
650.507.9844         (650) 507-9844
515.123.4444         (515) 123-4444

650.121.2874         (650) 121-2874
650.121.2004         (650) 121-2004
011.44.1344.429268   011.44.1344.429268
011.44.1344.467268   011.44.1344.467268


SELECT country_name,
       REGEXP_REPLACE(country_name, '(.)', '\1 ') "REGEXP_REPLACE"
  FROM countries;


COUNTRY_NAME                             REGEXP_REPLACE
---------------------------------------- --------------------------------------------------------------------------------
Argentina                                A r g e n t i n a
Australia                                A u s t r a l i a
Belgium                                  B e l g i u m
Brazil                                   B r a z i l
Canada                                   C a n a d a
Switzerland                              S w i t z e r l a n d
China                                    C h i n a
Germany                                  G e r m a n y
Denmark                                  D e n m a r k


The following example examines the string, looking for two or more spaces. Oracle replaces each occurrence of two or more spaces with a single space.

SELECT
  REGEXP_REPLACE('500   Oracle     Parkway,    Redwood  Shores, CA',
                 '( ){2,}', ' ') "REGEXP_REPLACE"
  FROM DUAL;
REGEXP_REPLACE
--------------------------------------
500 Oracle Parkway, Redwood Shores, CA

SELECT REGEXP_REPLACE('650!aaa.507.9833',
                      '([[:digit:]]{3})[!]([[:alpha:]]{3})\.([[:digit:]]{3})\.([[:digit:]]{4})',
                      '(\1) \2-\3 \4') re1,
       REGEXP_REPLACE('650!aaa.507.9833',
                      '([[:digit:]]{3})([!])([[:alpha:]]{3})\.([[:digit:]]{3})\.([[:digit:]]{4})',
                      '(\1) \2-\3 \4') Re2
  FROM dual t;

注:‘\1’指向 ‘(pattern)’。

你可能感兴趣的:(oracle,正则表达式函数)