PostgreSQL字符切割:substring函数详介

作为当前最强大的开源数据库,Postgresql(以下简称pg)对字符的处理也是最为强大的,首先他也有substr,trim等其他数据库都有的普通函数,这里我们介绍他更强大的一个函数substring,可以像python,java等编程语言一样使用正则表达式,强大到极点

在此之前我们先了解一下正则表达式最基础的四个

     %代表一个或多个字符    _代表一个字符    ^代表字符前   $代表字符后

pg的官网上对其用法是下面这样,但不够清楚了然,下面我一一解释

PostgreSQL字符切割:substring函数详介_第1张图片

  • 第一个用法和substr差不多,是指定序列,from 2 for 3 是从序列为2的位置开始取3个字符。例子如上
  • 第二个例子用法的意思是:$代表字符后, 一个点代表一个字符,即从最末尾开始选择3个字符,同样的如果是substring('Thomas' from '^....')  则结果是Thom
  • 第三个用法是最实用的,也是最难理解的,先大致理解:
    1. from '%#"o_a#"_'  for  '#'  中from是开始(包含),for后面跟的是逃逸,即结束
    2. 这个例子的意思是我想要o_a的组合字符,其中o_a的多个(%)字符不要,后面的一个(_)字符不要,这里要注意的是切分后面剩多少字符写几个_
    3. 这里的架构可以理解为固定的,即  from '#"#"'  for '#'     #" 是分割字符,可以在#"前中后限定选择你最想要的字符

下面用实例来讲解一下第三个用法

需求:下图的查询结果是查的日志表,我想要【】里的数据,由于【】里字符长度不固定,又只能用sql来切割,因此只能使用第三种方法来获取【】里的数据

PostgreSQL字符切割:substring函数详介_第2张图片

解决1:根据上面的思想,我可以写这样的架构'【#"%#"_______' FOR '#',试着运行一下

SELECT
	SUBSTRING (
		log_txt
		FROM
			'【#"%#"_______' FOR '#'
	) log_txt
FROM
	operation_log
WHERE
	log_type = '15'
LIMIT 3

PostgreSQL字符切割:substring函数详介_第3张图片

解决2:也可以根据position这个函数来解决,这个函数类似于python的index,就是把字符串的某个字符转变为该字符所在的位置数,如此一来便可以使用substring的第一个例子用法

即SUBSTRING ( log_txt  FROM 2  FOR  position('【'))

ooook  搞定了!!!

你可能感兴趣的:(sql)