MYSQL必知必会(四)正则表达式过滤数据

正则表达式

  • 使用MySQL正则表达式
    • 基本字符匹配
      • LIKE和REGEXP之间的区别
    • 进行OR匹配
    • 匹配几个字符之一
    • 匹配范围
    • 匹配特殊字符
    • 匹配字符类
    • 匹配多个实例
    • 定位符

使用MySQL正则表达式

基本字符匹配

##检索列prod_name包含文本1000的所有行
SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000'
ORDER BY prod_name;

在这里插入图片描述

REGEXP后所跟的东西作为正则表达式处理

SELECT prod_name
FROM products
WHERE prod_name REGEXP '.000'
ORDER BY prod_name;

MYSQL必知必会(四)正则表达式过滤数据_第1张图片

LIKE和REGEXP之间的区别

SELECT prod_name
FROM products
WHERE prod_name LIKE '1000'
ORDER BY prod_name;

在这里插入图片描述

SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000'
ORDER BY prod_name;

在这里插入图片描述
由上面的运行结果可知,第一条语句不返回数据,第二条语句返回一行,因为LIKE匹配整个列。如果被匹配的文本在列值中出现,LIKE将不会找到它,相应的行也不被返回,(除非使用通配符)。而REGEXP在列值内进行匹配,如果被匹配的文本在列值中出现,REGEXP将会找到它,相应的行将被返回。这是一个非常重要的差别。
注:匹配不区分大小写

进行OR匹配

为搜索两个串之一(或者为这个串,或者为另一个串),使用|,|为正则表达式的OR操作符。

SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000|2000'
ORDER BY prod_name;

在这里插入图片描述

匹配几个字符之一

SELECT prod_name
FROM products
WHERE prod_name REGEXP '[123] Ton'
ORDER BY prod_name;

MYSQL必知必会(四)正则表达式过滤数据_第2张图片注:正则表达式[123] Ton,[123]定义一组字符,它的意思是匹配1或2或3,因此,1 ton和2 ton都匹配且返回(没有3 ton)。
综上:[ ]是另一种形式的OR语句,事实上,正则表达式[123]Ton为[1|2|3]Ton的缩写,也可使用后者,但是,需要用[]来定义OR语句查找什么。

SELECT prod_name
FROM products
WHERE prod_name REGEXP '1|2|3 Ton'
ORDER BY prod_name;

MYSQL必知必会(四)正则表达式过滤数据_第3张图片可以看到,这并不是我们所期望的输出,两个要求的行,还检索出了另外3行,之所以这样是由于MySQL假定你的意思是’1’或’2’或’3 ton’。除非把字符|括在一个集合中,否则它将应用于整个串。

注:在集合开始处放置一个表示否定,[123]匹配除这些字符外的任何东西。

匹配范围

集合可用来定义要匹配的一个或多个字符
[0123456789]:表示数字0-9,简化后为[0-9],[a-z]表示任意数字列表

SELECT prod_name
FROM products
WHERE prod_name REGEXP '[1-5] Ton'
ORDER BY prod_name;

MYSQL必知必会(四)正则表达式过滤数据_第4张图片

匹配特殊字符

如果要找出包含.字符的值,怎样搜索?

SELECT vend_name
FROM vendors
WHERE vend_name REGEXP '.'
ORDER BY vend_name;

MYSQL必知必会(四)正则表达式过滤数据_第5张图片
这并不是期望的输出,.匹配任意字符,因此每个行都被检索出来
注:为了匹配特殊字符,必须用\为前导。\-表示查找-,\.表示查找.

SELECT vend_name
FROM vendors
WHERE vend_name REGEXP '\\.'
ORDER BY vend_name;

在这里插入图片描述注:这才是期望的输出。\.匹配.,所以只检索出一行。这种处理就是所谓的转义(escaping),正则表达式内具有特殊意义的所有字符都必须以这种方式转义

\也用来引用元字符(具有特殊含义的字符),如表所示:

MYSQL必知必会(四)正则表达式过滤数据_第6张图片
*注:匹配\为了匹配反斜杠(\)字符本身,需要使用\*

匹配字符类

MYSQL必知必会(四)正则表达式过滤数据_第7张图片

匹配多个实例

MYSQL必知必会(四)正则表达式过滤数据_第8张图片

SELECT prod_name
FROM products
WHERE prod_name REGEXP '\\([0-9] sticks?\\)'
ORDER BY vend_name;

MYSQL必知必会(四)正则表达式过滤数据_第9张图片
\([0-9] sticks?\):\(匹配),[0-9]匹配任意数字(这个例子中为1和5),sticks?匹配stick和sticks(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现),\)匹配)。没有?,匹配stick和sticks会非常困难。

SELECT prod_name
FROM products
WHERE prod_name REGEXP '[[:digit:]]{4}'
ORDER BY prod_name;

在这里插入图片描述
[:digit:]匹配任意数字,因而它为数字的一个集合。{4}确切地要求它前面的字符(任意数字)出现4次,所以[[:digit:]]{4}匹配连在一起的任意4位数字。

SELECT prod_name
FROM products
WHERE prod_name REGEXP '[0-9][0-9][0-9][0-9]'
ORDER BY prod_name;

和上个语句有同样的作用

定位符

MYSQL必知必会(四)正则表达式过滤数据_第10张图片
例如,如果你想找出以一个数(包括以小数点开始的数)开始的所有产品,怎么办?简单搜索[0-9\.](或[[:digit:]\.])不行,因为它将在文本内任意位置查找匹配。解决办法是使用^定位符

SELECT prod_name
FROM products
WHERE prod_name REGEXP '^[0-9\\.]'
ORDER BY prod_name;

MYSQL必知必会(四)正则表达式过滤数据_第11张图片

匹配串的开始。因此,[0-9\.] 只在.或任意数字为串中第一个字符时才匹配它们。没有^,则还要多检索出4个别的行 (那些中间有数字的行)。
注:

  1. ^的双重用途 ^有两种用法。在集合中(用[和]定义),用它来否定该集合,否则,用来指串的开始处。
  2. 使REGEXP起类似LIKE的作用 本章前面说过,LIKE和REGEXP的不同在于,LIKE匹配整个串而REGEXP匹配子串。利用定位符,通过用^开始每个表达式,用$结束每个表达式,可以使REGEXP的作用与LIKE一样。
  3. 简单的正则表达式测试可以在不使用数据库表的情况下用SELECT来测试正则表达式。REGEXP检查总是返回0(没有匹配)或1(匹配)。可以用带文字串的REGEXP来测试表达式,并试验它们。相应的语法如下:这个例子显然将返回0(因为文本hello中没有数字)。

你可能感兴趣的:(MYSQL必知必会(四)正则表达式过滤数据)