正则表达式在数据库中的应用

ORACLE中的支持正则表达式的函数主要有下面四个:
1,REGEXP_LIKE :与LIKE的功能相似
2,REGEXP_INSTR :与INSTR的功能相似
3,REGEXP_SUBSTR :与SUBSTR的功能相似
4,REGEXP_REPLACE :与REPLACE的功能相似
它们在用法上与Oracle SQL 函数LIKE、INSTR、SUBSTR 和REPLACE 用法相同,
但是它们使用POSIX 正则表达式代替了老的百分号(%)和通配符(_)字符。
POSIX 正则表达式由标准的元字符(metacharacters)所构成:
'^' 匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。
'$' 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹
配 '\n' 或 '\r'。
'.' 匹配除换行符之外的任何单字符。
'?' 匹配前面的子表达式零次或一次。
'+' 匹配前面的子表达式一次或多次。
'*' 匹配前面的子表达式零次或多次。
'|' 指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的
字符串。
'( )' 标记一个子表达式的开始和结束位置。
'[]' 标记一个中括号表达式。
'{m,n}' 一个精确地出现次数范围,m=<出现次数<=n,'{m}'表示出现m次,'{m,}'表示至少
出现m次。
\num 匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。
字符簇: 
[[:alpha:]] 任何字母。
[[:digit:]] 任何数字。
[[:alnum:]] 任何字母和数字。
[[:space:]] 任何白字符。
[[:upper:]] 任何大写字母。
[[:lower:]] 任何小写字母。
[[:punct:]] 任何标点符号。
[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。
各种操作符的运算优先级
\转义符
(), (?:), (?=), [] 圆括号和方括号
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, anymetacharacter 位置和顺序

*/
--创建表
create table fzq
(
id varchar(4),
value varchar(10)
);
--数据插入
insert into fzq values
('1','1234560');
insert into fzq values
('2','1234560');
insert into fzq values
('3','1b3b560');
insert into fzq values
('4','abc');
insert into fzq values
('5','abcde');
insert into fzq values
('6','ADREasx');
insert into fzq values
('7','123 45');
insert into fzq values
('8','adc de');
insert into fzq values
('9','adc,.de');
insert into fzq values
('10','1B');
insert into fzq values
('10','abcbvbnb');
insert into fzq values
('11','11114560');
insert into fzq values
('11','11124560');
--regexp_like
--查询value中以1开头60结束的记录并且长度是7位
select * from fzq where value like '1____60';
select * from fzq where regexp_like(value,'1....60');
--查询value中以1开头60结束的记录并且长度是7位并且全部是数字的记录。
--使用like就不是很好实现了。
select * from fzq where regexp_like(value,'1[0-9]{4}60');
-- 也可以这样实现,使用字符集。
select * from fzq where regexp_like(value,'1[[:digit:]]{4}60');
-- 查询value中不是纯数字的记录
select * from fzq where not regexp_like(value,'^[[:digit:]]+$');
-- 查询value中不包含任何数字的记录。
select * from fzq where regexp_like(value,'^[^[:digit:]]+$');
--查询以12或者1b开头的记录.不区分大小写。
select * from fzq where regexp_like(value,'^1[2b]','i');
--查询以12或者1b开头的记录.区分大小写。
select * from fzq where regexp_like(value,'^1[2B]');
-- 查询数据中包含空白的记录。
select * from fzq where regexp_like(value,'[[:space:]]');
--查询所有包含小写字母或者数字的记录。
select * from fzq where regexp_like(value,'^([a-z]+|[0-9]+)$');
--查询任何包含标点符号的记录。
select * from fzq where regexp_like(value,'[[:punct:]]');
/*
理解它的语法就可以了。其它的函数用法类似。

*/



mysql 正则表达式汇总

MySQL采用Henry Spencer的正则表达式实施,其目标是符合POSIX 1003.2。请参见附录C:感谢。MySQL采用了扩展的版本,以支持在SQL语句中与REGEXP操作符一起使用的模式匹配操作。请参见3.3.4.7节,“模式匹配”。

在本附录中,归纳了在MySQL中可用于REGEXP操作的特殊字符和结构,并给出了一些示例。本附录未包含可在Henry Spencer的regex(7)手册页面中发现的所有细节。该手册页面包含在MySQL源码分发版中,位于regex目录下的regex.7文件中。

正则表达式描述了一组字符串。最简单的正则表达式是不含任何特殊字符的正则表达式。例如,正则表达式hello匹配hello。

非平凡的正则表达式采用了特殊的特定结构,从而使得它们能够与1个以上的字符串匹配。例如,正则表达式hello|word匹配字符串hello或字符串word。

作为一个更为复杂的示例,正则表达式B[an]*s匹配下述字符串中的任何一个:Bananas,Baaaaas,Bs,以及以B开始、以s结束、并在其中包含任意数目a或n字符的任何其他字符串。

以下是可用于随REGEXP操作符的表的模式。

正则表达式在数据库中的应用_第1张图片

应用示例,查找用户表中Email格式错误的用户记录:

?
1
2
3
SELECT *
FROM users
WHERE email NOT REGEXP '^[A-Z0-9._%-]+@[A-Z0-9.-]+.[A-Z]{2,4}$'

MySQL数据库中正则表达式的语法,主要包括各种符号的含义。

(^)字符

匹配字符串的开始位置,如“^a”表示以字母a开头的字符串。

?
1
2
3
4
5
6
7
8
mysql> select 'xxxyyy' regexp '^xx' ;
 
+ -----------------------+
| 'xxxyyy' regexp '^xx' |
+ -----------------------+
|           1 |
+ -----------------------+
1 row in set (0.00 sec)

查询xxxyyy字符串中是否以xx开头,结果值为1,表示值为true,满足条件。

($)字符

匹配字符串的结束位置,如“X^”表示以字母X结尾的字符串。

(.)字符

这个字符就是英文下的点,它匹配任何一个字符,包括回车、换行等。

(*)字符

星号匹配0个或多个字符,在它之前必须有内容。如:

?
1
mysql> select 'xxxyyy' regexp 'x*' ;

这个SQL语句,正则匹配为true。

(+)字符

加号匹配1个或多个字符,在它之前也必须有内容。加号跟星号的用法类似,只是星号允许出现0次,加号则必须至少出现一次。

(?)字符

问号匹配0次或1次。

实例:

现在根据上面的表,可以装置各种不同类型的SQL查询以满足要求。在这里列出一些理解。考虑我们有一个表为person_tbl和有一个字段名为名称:

查询找到所有的名字以'st'开头

?
1
mysql> SELECT name FROM person_tbl WHERE name REGEXP '^st' ;

查询找到所有的名字以'ok'结尾

?
1
mysql> SELECT name FROM person_tbl WHERE name REGEXP 'ok$' ;

查询找到所有的名字包函'mar'的字符串

?
1
mysql> SELECT name FROM person_tbl WHERE name REGEXP 'mar' ;

查询找到所有名称以元音开始和'ok'结束 的

?
1
mysql> SELECT name FROM person_tbl WHERE name REGEXP '^[aeiou]|ok$' ;

一个正则表达式中的可以使用以下保留字

^

所匹配的字符串以后面的字符串开头

?
1
2
mysql> select "fonfo" REGEXP "^fo$" ; -> 0(表示不匹配)
mysql> select "fofo" REGEXP "^fo" ; -> 1(表示匹配)

$

所匹配的字符串以前面的字符串结尾

?
1
2
3
mysql> select "fono" REGEXP "^fono$" ; -> 1(表示匹配)
mysql> select "fono" REGEXP "^fo$" ; -> 0(表示不匹配)
.

匹配任何字符(包括新行)

?
1
2
mysql> select "fofo" REGEXP "^f.*" ; -> 1(表示匹配)
mysql> select "fonfo" REGEXP "^f.*" ; -> 1(表示匹配)

a*

匹配任意多个a(包括空串)

?
1
2
3
mysql> select "Ban" REGEXP "^Ba*n" ; -> 1(表示匹配)
mysql> select "Baaan" REGEXP "^Ba*n" ; -> 1(表示匹配)
mysql> select "Bn" REGEXP "^Ba*n" ; -> 1(表示匹配)

a+

匹配任意多个a(不包括空串)

?
1
2
mysql> select "Ban" REGEXP "^Ba+n" ; -> 1(表示匹配)
mysql> select "Bn" REGEXP "^Ba+n" ; -> 0(表示不匹配)

a?

匹配一个或零个a

?
1
2
3
mysql> select "Bn" REGEXP "^Ba?n" ; -> 1(表示匹配)
mysql> select "Ban" REGEXP "^Ba?n" ; -> 1(表示匹配)
mysql> select "Baan" REGEXP "^Ba?n" ; -> 0(表示不匹配)

de|abc

匹配de或abc

?
1
2
3
4
5
6
mysql> select "pi" REGEXP "pi|apa" ; -> 1(表示匹配)
mysql> select "axe" REGEXP "pi|apa" ; -> 0(表示不匹配)
mysql> select "apa" REGEXP "pi|apa" ; -> 1(表示匹配)
mysql> select "apa" REGEXP "^(pi|apa)$" ; -> 1(表示匹配)
mysql> select "pi" REGEXP "^(pi|apa)$" ; -> 1(表示匹配)
mysql> select "pix" REGEXP "^(pi|apa)$" ; -> 0(表示不匹配)

(abc)*

匹配任意多个abc(包括空串)

?
1
2
3
mysql> select "pi" REGEXP "^(pi)*$" ; -> 1(表示匹配)
mysql> select "pip" REGEXP "^(pi)*$" ; -> 0(表示不匹配)
mysql> select "pipi" REGEXP "^(pi)*$" ; -> 1(表示匹配)

{1}
{2,3}

这是一个更全面的方法,它可以实现前面好几种保留字的功能

a*

可以写成a{0,}

a+

可以写成a{1,}

a?

可以写成a{0,1}

   在{}内只有一个整型参数i,表示字符只能出现i次;在{}内有一个整型参数i,后面跟一个“,”,表示字符可以出现i次或i次以上;在{}内只有一个整型参数i,后面跟一个“,”,再跟一个整型参数j,表示字符只能出现i次以上,j次以下(包括i次和j次)。其中的整型参数必须大于等于0,小于等于 RE_DUP_MAX(默认是255)。 如果有两个参数,第二个必须大于等于第一个

[a-dX]

匹配“a”、“b”、“c”、“d”或“X”

[^a-dX]

匹配除“a”、“b”、“c”、“d”、“X”以外的任何字符。

“[”、“]”必须成对使用

?
1
2
3
4
5
6
mysql> select "aXbc" REGEXP "[a-dXYZ]" ; -> 1(表示匹配)
mysql> select "aXbc" REGEXP "^[a-dXYZ]$" ; -> 0(表示不匹配)
mysql> select "aXbc" REGEXP "^[a-dXYZ]+$" ; -> 1(表示匹配)
mysql> select "aXbc" REGEXP "^[^a-dXYZ]+$" ; -> 0(表示不匹配)
mysql> select "gheis" REGEXP "^[^a-dXYZ]+$" ; -> 1(表示匹配)
mysql> select "gheisa" REGEXP "^[^a-dXYZ]+$" ; -> 0(表示不匹配)

你可能感兴趣的:(sql)