SQL - 使用正则对数据进行过滤

1、基本字符匹配

数据库使用正则进行过滤,写法与like语句非常相似,只需将“like"关键字改为"regexp"即可。我们先来看一个最简单的正则匹配:

select *
from mostimes
where name regexp '666'

分析:这条sql语句表达是字段中包含"666"即为匹配对象。

正则也可以像like语句那样任意匹配一个字符:

select *
from mostimes
where name regexp '.66'

分析:这里使用了正则表达式" .66 “,” . "是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符,因此,566、666、766等都匹配且返回。

2、进行OR匹配

OR匹配与C语言的按位或很相似,使用" | "符号,表示符号两边任意一个串匹配了,即返回。用法如下所示:

select *
from mostimes
where name regexp '666|888'

分析:语句中使用了正则表达式"666|888"。" | "为正则表达式的OR操作符。它表示匹配其中之一,因此name字段为666和888都匹配并返回。

3、匹配几个字符之一

顾名思义,该方法是匹配多个字符中的其中一个,用法:

select *
from mostimes
where name regexp '[abc]mos'

分析:使用了正则表达式"[abc]mos"。[abc]定义一组字符,它的意思是匹配a或b或c,因此,amos、bmos和cmos都匹配且返回。

4、匹配范围

在第3个匹配方法中,我们可以对其进行简化,当我们需要匹配"[01234567]mos"时,我们还可以使用下面更简洁的方法:

select *
from mostimes
where name regexp '[0-7]mos'

分析:使用" - "可以简化这种连续字符类型的集合,此外,[a-z]也适用此方法。

5、匹配特殊字符

在前面的几种的匹配方式中,我们可以看到,正则表达式语言是由具有特定含义的特殊字符构成的,那如果我们想要匹配那些特殊字符的时候,就会出现sql注入问题,例如我们需要匹配" . “的时候,那么数据库就会将” . "当做一个任意通配符来匹配,达不到我们期望的值,这个时候我们就需要对其进行转义,例:

select *
from mostimes
where name regexp '\\.mos'

分析:可以看到,我们在‘.’符号的前面加了" \ “,加上双斜杆,数据库就会把” . "符号当做一个普通符号来匹配,其中还包括|、[]以及迄今为止使用过的其他特殊字符。

如果需要对‘\’进行转义时,那么我们就需要使用‘\\\’

6、匹配字符类

存在找出你自己经常使用的数字、所有字母字符或所有数字字母字符等的匹配。为更方便工作,可以使用预定义的字符集,称为字符类,具体可以看下表。

说明
[:alnum:] 任意字母和数字(同[a-zA-Z0-9])
[:alpha:] 任意字符(同[a-zA-Z])
[:blank:] 空格和制表(同[\t])
[:cntrl:] ASCII控制字符(ASCII 0到31和127)
[:digit:] 任意数字(同[0-9])
[:graph:] 与[:print:]相同,但不包括空格
[:lower:] 任意小写字母(同[a-z])
[:print:] 任意可打印字符
[:punct:] 既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:] 包括空格在内的任意空白字符(同[\f\n\r\t\v])
[:upper:] 任意大写字母(同[A-Z])
[:xdigit:] 任意十六进制数字(同[a-fA-F0-9])

例子:

select * 
from mostimes
where name REGEXP '[:alnum:]'

分析:表示匹配任意字母和数字,其他的大家可以试下。

7、匹配多个实例

在我们前面学习的几种正则表达式中,所有的匹配都是以单次出现进行匹配的。但有时候我们需要对匹配的次数进行更强的控制,这个时候我们就可以使用重复元字符来匹配。看下表:

元 字 符 说 明
* 0个或多个匹配
+ 1个或多个匹配(等于{1,})
? 0个或1个匹配(等于{0,1})
{n} 指定数目的匹配
{n,} 不少于指定数目的匹配
{n,m} 匹配数目的范围(m不超过255)

例子:

select * 
from mostimes
where name REGEXP '[0-9]mostimes?'

分析:"[0-9]"表示匹配任意数字,"mostimes?"匹配mostime和mostimes(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现),所以0mostime、1mostimes等都可以匹配。

8、定位符

现在有一个需求,就是需要在串中的指定位置匹配串,但是学的前面那几种都是在文本内任意位置查找匹配,那这个时候我们就可以使用定位符来解决。看下表:

元 字 符 说 明
^ 文本的开始
$ 文本的结尾
[[:<:]] 词的开始
[[:>:]] 词的结尾

例子:

select * 
from mostimes
where name REGEXP '^[0-9]mos'

分析:" ^ "表示匹配串的开始。所以该语句表示在串开头进行匹配,1mos、2mos、3mos等可以匹配,a1mos、aa1mos等不可以匹配。

9、like语句与正则

like语句与正则的相类似,但是它们的不同点就是like匹配的是整个串,而正则匹配的是子串,但是可以使用定位符“^”与“$”相结合,达到like语句的效果。

你可能感兴趣的:(数据库,sql,正则表达式,数据库)