MySQL字符串函数及使用

DB version： 5.7.25-log

一、字符串常规函数

二、字符串比较函数

三、正则表达式

四、字符集和排序规则函数

一、字符串常规函数

ASCII(str)返回字符串中第一个字符的ascii码，如果字符串为空，则返回0，为NULL，则返回NULL。只适合单字节的字符，不适用于多字节，如汉字。
多字节用 ORD(str)。

mysql> select ascii('123');
+--------------+
| ascii('123') |
+--------------+
|           49 |
+--------------+
mysql> select ascii(1);
+----------+
| ascii(1) |
+----------+
|       49 |
+----------+
mysql> select ascii('a');
+------------+
| ascii('a') |
+------------+
|         97 |
+------------+
mysql> select ascii('abc');
+--------------+
| ascii('abc') |
+--------------+
|           97 |
+--------------+
mysql> select ascii('');
+-----------+
| ascii('') |
+-----------+
|         0 |
+-----------+
mysql> select ascii(NULL);
+-------------+
| ascii(NULL) |
+-------------+
| NULL        |
+-------------+

ORD(str) 如果字符串str的第一个字符是多字节字符，则返回该字符的代码，该代码使用以下公式根据其组成字节的数值计算得出：

(1st byte code) + (2nd byte code * 256) + (3rd byte code * 256^2) ...

mysql> select ord('我');
+-----------+
| ord('我') |
+-----------+
|  15108241 |
+-----------+
mysql> select ord('我是中国人');
+-------------------+
| ord('我是中国人') |
+-------------------+
|          15108241 |
+-------------------+

计算公式：
mysql> SELECT hex(CONVERT( '我' USING utf8 ));
+---------------------------------+
| hex(CONVERT( '我' USING utf8 )) |
+---------------------------------+
| E68891                          |
+---------------------------------+
将三个字节对应的编码转为10进制再乘以256的次方。
第一个字节 91 ：(9*16+1)
第二个字节 88 ：(8*16+8)*256
第三个字节 E6 ：(14*16+6)*256*256

mysql> select (9*16+1)+(8*16+8)*256+(14*16+6)*256*256 as res;
+----------+
| res      |
+----------+
| 15108241 |
+----------+

如果字符串str的第一个字符是单字节字符，则返回与ASCII(str) 相同的值。
mysql> select ord('a我是中国人');
+--------------------+
| ord('a我是中国人') |
+--------------------+
|                 97 |
+--------------------+

BIN(N) 返回N的二进制值的字符串表示形式，其中N是一个BIGINT数字。最大可为2^64。

如果N为NULL或''，则返回NULL；
如果N为非数字，则返回0。

mysql> select bin(1234);
+-------------+
| bin(1234)   |
+-------------+
| 10011010010 |
+-------------+
mysql> select bin(NULL);
+-----------+
| bin(NULL) |
+-----------+
| NULL      |
+-----------+
mysql> select bin('');
+---------+
| bin('') |
+---------+
| NULL    |
+---------+
mysql> select bin('w');
+----------+
| bin('w') |
+----------+
| 0        |
+----------+
mysql> select bin('我');
+-----------+
| bin('我') |
+-----------+
| 0         |
+-----------+

BIT_LENGTH(str) 以位为单位返回字符串str的长度。

gbk 编码下一个汉字占两个字节
mysql> select bit_length(CONVERT( '我' USING gbk )) ;
+----------------------------------------+
| bit_length(CONVERT( '我' USING gbk ))  |
+----------------------------------------+
|                                     16 |
+----------------------------------------+
utf8 编码下一个汉字占三个字节，24位
mysql> select bit_length(CONVERT( '我' USING utf8mb4 ));
+--------------------------------------------+
| bit_length(CONVERT( '我' USING utf8mb4 ))  |
+--------------------------------------------+
|                                         24 |
+--------------------------------------------+
emoji表情只能用 utf8mb4保存，且占四个字节，32位
mysql> select bit_length(CONVERT( '' USING utf8mb4 )) ;
+------------------------------------------+
| bit_length(CONVERT( '?' USING utf8mb4 )) |
+------------------------------------------+
|                                       32 |
+------------------------------------------+

CHAR(N) 返回N整数部分在ascii码表对应的字符（N为小数，则舍弃小数位）
1.NULL被跳过，不返回任何东西；
2.ascii码只有256（0-255）个，超过255的数字将被转换成多个字节结果；
3.默认返回二进制字符集，可用using语句进行指定字符集。

mysql> SELECT CHAR(77,121,null,83,81,'76');
+------------------------------+
| CHAR(77,121,null,83,81,'76') |
+------------------------------+
| MySQL                        |
+------------------------------+
mysql> SELECT CHAR(81,81.12,'81.3');
+-----------------------+
| CHAR(81,81.12,'81.3') |
+-----------------------+
| QQQ                   |
+-----------------------+
超过255被转为多字节
CHAR(256) 等价于 CHAR(1,0)，CHAR(65535)等价于CHAR(255,255)，以此类推 
mysql> SELECT HEX(CHAR(255)),HEX(CHAR(256)),HEX(CHAR(1,0)),HEX(CHAR(65535)),HEX(CHAR(255,255)),HEX(CHAR(65536)),HEX(CHAR(1,0,0)); 
+----------------+----------------+----------------+------------------+--------------------+------------------+------------------+
| HEX(CHAR(255)) | HEX(CHAR(256)) | HEX(CHAR(1,0)) | HEX(CHAR(65535)) | HEX(CHAR(255,255)) | HEX(CHAR(65536)) | HEX(CHAR(1,0,0)) |
+----------------+----------------+----------------+------------------+--------------------+------------------+------------------+
| FF             | 0100           | 0100           | FFFF             | FFFF               | 010000           | 010000           |
+----------------+----------------+----------------+------------------+--------------------+------------------+------------------+
如果给出了USING并且结果字符串对于给定的字符集是非法的，则会发出警告。 
如果启用了严格的SQL模式，则CHAR（）的结果将为NULL。
mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));
+---------------------+--------------------------------+
| CHARSET(CHAR(0x65)) | CHARSET(CHAR(0x65 USING utf8)) |
+---------------------+--------------------------------+
| binary              | utf8                           |
+---------------------+--------------------------------+

CHARACTER_LENGTH(str) 是CHAR_LENGTH()的同义词，见下

CHAR_LENGTH(str)返回字符串str的长度，以字符为单位。不论多字节还是单字节字符均算作单个字符。

mysql> SELECT CHAR_LENGTH('MySQL'), CHAR_LENGTH('我是中国人');
+----------------------+---------------------------+
| CHAR_LENGTH('MySQL') | CHAR_LENGTH('我是中国人') |
+----------------------+---------------------------+
|                    5 |                         5 |
+----------------------+---------------------------+

CONCAT(str1,str2,...) 返回由一个或多个参数连接产生的字符串。
1.如果所有参数均为非二进制字符串，则结果为非二进制字符串。
2.如果参数包含任何二进制字符串，则结果为二进制字符串。
3.数字参数将转换为其等效的非二进制字符串形式。
4.连接的字符串中存在NULL，则返回NULL

mysql> SELECT CONCAT('My', 'S', 'QL'),CHARSET(CONCAT('My', 'S', 'QL')), CONCAT('My', 'S',NULL, 'QL'),CONCAT(X'65','f',12),CHARSET(CONCAT(X'65','f',12));
+-------------------------+----------------------------------+------------------------------+----------------------+-------------------------------+
| CONCAT('My', 'S', 'QL') | CHARSET(CONCAT('My', 'S', 'QL')) | CONCAT('My', 'S',NULL, 'QL') | CONCAT(X'65','f',12) | CHARSET(CONCAT(X'65','f',12)) |
+-------------------------+----------------------------------+------------------------------+----------------------+-------------------------------+
| MySQL                   | utf8mb4                          | NULL                         | ef12                 | binary                        |
+-------------------------+----------------------------------+------------------------------+----------------------+-------------------------------+
对于带引号的字符串，可以通过将字符串彼此相邻放置来实现串联
mysql> SELECT 'My' 'S' 'QL'  as res ;
+-------+
| res   |
+-------+
| MySQL |
+-------+

CONCAT_WS(separator,str1,str2,...) 代表用分隔符连接，是CONCAT()的一种特殊形式。
1.第一个参数是分隔符, 分隔符被添加到要连接的字符串之间；
2.分隔符可以是字符串，其余参数也可以；
3.如果分隔符为NULL，则结果为NULL；
4.不会跳过空字符串，但是，它会跳过分隔符参数之后的所有NULL值。

mysql> SELECT CONCAT_WS(',','First name','Last Name'),CONCAT_WS(NULL,'First name','Last Name'),CONCAT_WS(',','First name','','Last Name'), CONCAT_WS(',','First name',NULL,'Last Name');
+-----------------------------------------+------------------------------------------+--------------------------------------------+----------------------------------------------+
| CONCAT_WS(',','First name','Last Name') | CONCAT_WS(NULL,'First name','Last Name') | CONCAT_WS(',','First name','','Last Name') | CONCAT_WS(',','First name',NULL,'Last Name') |
+-----------------------------------------+------------------------------------------+--------------------------------------------+----------------------------------------------+
| First name,Last Name                    | NULL                                     | First name,,Last Name                      | First name,Last Name                         |
+-----------------------------------------+------------------------------------------+--------------------------------------------+----------------------------------------------+

EXPORT_SET(bits,on,off[,separator[,number_of_bits]]) 这函数鄙人第一次用。Talk is cheap，show you the code

mysql> SELECT EXPORT_SET(111,'1对应我','0对应我','|',10);
+---------------------------------------------------------------------------------+
| EXPORT_SET(111,'1对应我','0对应我','|',10)                                      |
+---------------------------------------------------------------------------------+
| 1对应我|1对应我|1对应我|1对应我|0对应我|1对应我|1对应我|0对应我|0对应我|0对应我 |
+---------------------------------------------------------------------------------+
转换步骤:
1.将 bits 转换为二进制，这里是111，二进制为  1101111 ；
2.对 1101111 从低到高位排序得到   1111011 ；
3.number_of_bits=10，表示总位数为10，不足时右侧补0，得到   1111011000 ；
4.然后将 1 替换成 '1对应我' ，0 替换成 '0对应我' ，得到最终结果。

ELT(N,str1,str2,str3,...) 返回字符串列表的第N个元素：如果N = 1，则返回str1；如果N = 2，则返回str2，依此类推。如果N小于1或大于参数个数，则返回NULL。 ELT（）是FIELD（）函数的补充。

mysql> SELECT ELT(1, 'Aa', 'Bb', 'Cc', 'Dd'),ELT(3, 'Aa', 'Bb', 'Cc', 'Dd'),ELT(7, 'Aa', 'Bb', 'Cc', 'Dd') ;
+--------------------------------+--------------------------------+--------------------------------+
| ELT(1, 'Aa', 'Bb', 'Cc', 'Dd') | ELT(3, 'Aa', 'Bb', 'Cc', 'Dd') | ELT(7, 'Aa', 'Bb', 'Cc', 'Dd') |
+--------------------------------+--------------------------------+--------------------------------+
| Aa                             | Cc                             | NULL                           |
+--------------------------------+--------------------------------+--------------------------------+

FIELD(str,str1,str2,str3,...) 返回str在字符串 str1,str2,str3,... 中所在的位置，如找不到，则返回0。若str为NULL，则返回0。FIELD（）亦是ELT（）的补充。

mysql> SELECT FIELD('Bb', 'Aa', 'Bb', 'Cc'),FIELD('Dd', 'Aa', 'Bb', 'Cc'),FIELD(NULL, 'Aa', 'Bb', 'Cc');
+-------------------------------+-------------------------------+-------------------------------+
| FIELD('Bb', 'Aa', 'Bb', 'Cc') | FIELD('Dd', 'Aa', 'Bb', 'Cc') | FIELD(NULL, 'Aa', 'Bb', 'Cc') |
+-------------------------------+-------------------------------+-------------------------------+
|                             2 |                             0 |                             0 |
+-------------------------------+-------------------------------+-------------------------------+

FIND_IN_SET(str,strlist) 返回str在字符串strlist中的位置。如果str是字符串，strlist是一个集合，则FIND_IN_SET（）将会被优化成位运算。

mysql> SELECT FIND_IN_SET('b','a,b,c,d'),FIND_IN_SET('e','a,b,c,d'),FIND_IN_SET(NULL,'a,b,c,d'),FIND_IN_SET('b','a,NULL,b,c,d'),FIND_IN_SET('b,','a,b,c,d'),FIND_IN_SET('中','我,是,中,国,人');
+----------------------------+----------------------------+-----------------------------+---------------------------------+-----------------------------+------------------------------------+
| FIND_IN_SET('b','a,b,c,d') | FIND_IN_SET('e','a,b,c,d') | FIND_IN_SET(NULL,'a,b,c,d') | FIND_IN_SET('b','a,NULL,b,c,d') | FIND_IN_SET('b,','a,b,c,d') | FIND_IN_SET('中','我,是,中,国,人') |
+----------------------------+----------------------------+-----------------------------+---------------------------------+-----------------------------+------------------------------------+
|                          2 |                          0 | NULL                        |                               3 |                           0 |                                  3 |
+----------------------------+----------------------------+-----------------------------+---------------------------------+-----------------------------+------------------------------------+

FORMAT(X,D[,locale]) 将数字X格式化为类似于 '#,###,###.##' 的格式，四舍五入到D小数位，然后将结果作为字符串返回。如果D为0，则结果没有小数点或小数部分。可选的第三个参数允许指定语言环境，以用于结果数字的小数点，千位分隔符以及分隔符之间的分组。允许的语言环境值与lc_time_names系统变量的合法值相同，如果未指定语言环境，则默认值为“ en_US”。

mysql> SELECT FORMAT(12332.123456, 4), FORMAT(12332.12,4), FORMAT(12332.123456, 0), FORMAT(12332.1, 2,'en_US'), FORMAT(12332.123456, 2,'de_DE');
+-------------------------+--------------------+-------------------------+----------------------------+---------------------------------+
| FORMAT(12332.123456, 4) | FORMAT(12332.12,4) | FORMAT(12332.123456, 0) | FORMAT(12332.1, 2,'en_US') | FORMAT(12332.123456, 2,'de_DE') |
+-------------------------+--------------------+-------------------------+----------------------------+---------------------------------+
| 12,332.1235             | 12,332.1200        | 12,332                  | 12,332.10                  | 12.332,12                       |
+-------------------------+--------------------+-------------------------+----------------------------+---------------------------------+

FROM_BASE64(str) 解码由函数TO_BASE64()编码得到的字符串。如果str为NULL或不是有效的base-64编码则返回NULL。

mysql> SELECT TO_BASE64('我'),FROM_BASE64(TO_BASE64('我')),FROM_BASE64(NULL);
+-----------------+------------------------------+-------------------+
| TO_BASE64('我') | FROM_BASE64(TO_BASE64('我')) | FROM_BASE64(NULL) |
+-----------------+------------------------------+-------------------+
| 5oiR            | 我                           | NULL              |
+-----------------+------------------------------+-------------------+

TO_BASE64(str) 将字符串以base-64编码后返回。如果参数不是字符串，则在进行转换之前将其转换为字符串。解码时用FROM_BASE64(str)。
1.The encoding for alphabet value 62 is '+'（未理解）
2.The encoding for alphabet value 63 is '/'（未理解）
3.输入数据的每3个字节使用4个字符进行编码。如果最后一组不完整，则用'='字符填充，长度为4。
4.在编码输出的每76个字符之后添加一个换行符，以将长输出分成多行。
5.解码识别并忽略换行符，回车符，制表符和空格。

mysql> SELECT TO_BASE64('ab'),TO_BASE64('abc'),TO_BASE64(NULL),FROM_BASE64('YW Jj') ;
+-----------------+------------------+-----------------+----------------------+
| TO_BASE64('ab') | TO_BASE64('abc') | TO_BASE64(NULL) | FROM_BASE64('YW Jj') |
+-----------------+------------------+-----------------+----------------------+
| YWI=            | YWJj             | NULL            | abc                  |
+-----------------+------------------+-----------------+----------------------+

输出超过76个字符则换行
mysql> SELECT TO_BASE64('abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz');
+----------------------------------------------------------------------------------------------------------------------------------------------+
| TO_BASE64('abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz')                        |
+----------------------------------------------------------------------------------------------------------------------------------------------+
| YWJjZGVmZ2hpamtsbW5vcHFyc3R1dnd4eXphYmNkZWZnaGlqa2xtbm9wcXJzdHV2d3h5emFiY2Rl
ZmdoaWprbG1ub3BxcnN0dXZ3eHl6YWJjZGVmZ2hpamtsbW5vcHFyc3R1dnd4eXo= |
+----------------------------------------------------------------------------------------------------------------------------------------------+

HEX(str), HEX(N)返回没有字符或数字的16进制编码。

mysql> SELECT HEX('我'),HEX('ab'),HEX(255),UNHEX('E68891');
+-----------+-----------+----------+-----------------+
| HEX('我') | HEX('ab') | HEX(255) | UNHEX('E68891') |
+-----------+-----------+----------+-----------------+
| E68891    | 6162      | FF       | 我              |
+-----------+-----------+----------+-----------------+

UNHEX(str) 对于字符串参数str，UNHEX（str）将参数中的每对字符解释为十六进制数字，并将其转换为该数字表示的字节。返回值是一个二进制字符串。
1.参数字符串中的字符必须为合法的十六进制数字：“ 0” ..“ 9”，“ A” ..“ F”，“ a” ..“ f”。如果参数包含任何非十六进制数字，则结果为NULL；
2.如果UNHEX（）的参数是BINARY列，则可能会返回NULL；
3.对于数字参数N，HEX（N）的解码不是UNHEX（），改用CONV（HEX（N），16,10）。

mysql> SELECT UNHEX('62'),UNHEX('E68891'),HEX(255),UNHEX('FF'),CONV('FF',16,10);
+-------------+-----------------+----------+-------------+------------------+
| UNHEX('62') | UNHEX('E68891') | HEX(255) | UNHEX('FF') | CONV('FF',16,10) |
+-------------+-----------------+----------+-------------+------------------+
| b           | 我              | FF       | �           | 255              |
+-------------+-----------------+----------+-------------+------------------+

INSERT(str,pos,len,newstr) 返回字符串str，子字符串从pos位置开始，并且len个字符由字符串newstr取代。
1.如果pos不在字符串的长度内，则返回原始字符串。
2.如果len不在字符串其余部分的长度内，则从位置pos替换字符串的其余部分。
3.如果任何参数为NULL，则返回NULL。

mysql> SELECT INSERT('who are you?', 1, 3, 'where'),INSERT('who are you?', -1, 3, 'where'),INSERT('who are you?', 1, 100, 'where'),INSERT('我是中国人', 3, 3, '渣渣辉');
+---------------------------------------+----------------------------------------+-----------------------------------------+--------------------------------------+
| INSERT('who are you?', 1, 3, 'where') | INSERT('who are you?', -1, 3, 'where') | INSERT('who are you?', 1, 100, 'where') | INSERT('我是中国人', 3, 3, '渣渣辉') |
+---------------------------------------+----------------------------------------+-----------------------------------------+--------------------------------------+
| where are you?                        | who are you?                           | where                                   | 我是渣渣辉                           |
+---------------------------------------+----------------------------------------+-----------------------------------------+--------------------------------------+

INSTR(str,substr)返回substr在str中第一次出现的位置，如果str或substr为NULL，则返回NULL。和两个参数的LOCATE(substr,str)相同，只是参数顺序相反。见下

mysql> SELECT INSTR('goodboy','boy'),INSTR('goodboy','o'),INSTR('goodboy','bye'),INSTR('goodboy',NULL);
+------------------------+----------------------+------------------------+-----------------------+
| INSTR('goodboy','boy') | INSTR('goodboy','o') | INSTR('goodboy','bye') | INSTR('goodboy',NULL) |
+------------------------+----------------------+------------------------+-----------------------+
|                      5 |                    2 |                      0 |                  NULL |
+------------------------+----------------------+------------------------+-----------------------+

POSITION(substr IN str) 为LOCATE(substr,str)的同义词，见下

LOCATE(substr,str), LOCATE(substr,str,pos)第一个表达式返回substr在str中第一次出现的位置，与INSTR()一样。第二个表达式返回从str的pos位置往后第一次出现substr的位置。

mysql> SELECT LOCATE('boy','goodboy'),LOCATE('o','goodboy',5),LOCATE(NULL,'goodboy');
+-------------------------+-------------------------+------------------------+
| LOCATE('boy','goodboy') | LOCATE('o','goodboy',5) | LOCATE(NULL,'goodboy') |
+-------------------------+-------------------------+------------------------+
|                       5 |                       6 |                   NULL |
+-------------------------+-------------------------+------------------------+

LCASE(str) 为函数LOWER(str)的同义词，见下

LOWER(str) 根据当前字符集，返回字符串str的小写形式，默认字符集latin1。对应将str转为大写的函数UPPER（str）。
1.当应用于二进制字符串（BINARY，VARBINARY，BLOB）时，LOWER（）和UPPER（）无效。需要先将str中的数据字符集转换为非二进制。
2.早期版本中，视图里的LOWER（）会被改写成LCASE（），5.7中，LOWER（）将不会被改写。

mysql> SELECT LOWER('Good Boy'),LOWER(BINARY 'Good Boy'),LOWER(CONVERT(BINARY 'Good Boy' using utf8));
+-------------------+--------------------------+--------------------------------------------+
| LOWER('Good Boy') | LOWER(BINARY 'Good Boy') | LOWER(CONVERT(BINARY 'Good Boy' using utf8)) |
+-------------------+--------------------------+--------------------------------------------+
| good boy          | Good Boy                 | good boy                                   |
+-------------------+--------------------------+--------------------------------------------+

UCASE(str)为函数UPPER(str)的同义词，见下

UPPER(str) 根据当前字符集，返回字符串str的大写形式，默认字符集latin1。对应将str转为小写的函数LOWER（str）。

mysql> SELECT UPPER('Good Boy'),UPPER(BINARY 'Good Boy'),UPPER(CONVERT(BINARY 'Good Boy' using utf8));
+-------------------+--------------------------+----------------------------------------------+
| UPPER('Good Boy') | UPPER(BINARY 'Good Boy') | UPPER(CONVERT(BINARY 'Good Boy' using utf8)) |
+-------------------+--------------------------+----------------------------------------------+
| GOOD BOY          | Good Boy                 | GOOD BOY                                     |
+-------------------+--------------------------+----------------------------------------------+

LEFT(str,len)返回字符串str中最左边的len个字符；如果任何参数为NULL，则返回NULL。相对应的函数RIGHT(str,len)。见下

mysql> SELECT LEFT('Good Boy',4);
+------------------+
| LEFT('Good Boy',4) |
+------------------+
| Good            |
+------------------+

RIGHT(str,len)返回字符串str中最右边的len个字符；

mysql> SELECT RIGHT('Good Boy',5);
+-------------------+
| RIGHT('Good Boy',5) |
+-------------------+
| d Boy             |
+-------------------+

OCTET_LENGTH(str) 为LENGTH(str)的同义词，见下

LENGTH(str) 以字节为单位返回字符串str的长度。多字节字符计为多个字节。这意味着对于包含5个2字节字符的字符串，LENGTH（）返回10，而CHAR_LENGTH（）返回5。

mysql> SELECT LENGTH('text'),CHARSET('左轮'),LENGTH('左轮');
+----------------+-------------------+------------------+
| LENGTH('text') | CHARSET('左轮')   | LENGTH('左轮')   |
+----------------+-------------------+------------------+
|              4 | utf8              |                6 |
+----------------+-------------------+------------------+

LOAD_FILE(file_name) 读取文件内容并以字符串形式返回。
1.用户需要有file权限；
2.文件不要超过 max_allowed_packet大小；
3.参数secure_file_priv需要为非NULL，且指定到一个目录路径；
4.如果文件不可读或者不存在，则返回NULL。

mysql>  SELECT LOAD_FILE('D:\\A.TXT'),LOAD_FILE('D:\\B.TXT');
+------------------------+------------------------+
| LOAD_FILE('D:\\A.TXT') | LOAD_FILE('D:\\B.TXT') |
+------------------------+------------------------+
| HAHAHAA                | NULL                   |
+------------------------+------------------------+
可以用文件里的数据更新表中的字段。
mysql> UPDATE T SET T_NAME=LOAD_FILE('D:\\A.TXT') WHERE T_ID = '01';

LPAD(str,len,padstr) 返回字符串str
1.如果len > str 的长度，则用padstr左填充str至len长度；
2.如果len < str 的长度，则返回len长度的字符；
3.相对应函数RPAD（str）。

mysql> SELECT LPAD('GoodBoy',12,'$'),LPAD('GoodBoy',4,'$');
+------------------------+-----------------------+
| LPAD('GoodBoy',12,'$') | LPAD('GoodBoy',4,'$') |
+------------------------+-----------------------+
| $$$$$GoodBoy           | Good                  |
+------------------------+-----------------------+

RPAD(str,len,padstr) 返回字符串str，用法同LPAD(str,len,padstr)

mysql>  SELECT RPAD('GoodBoy',12,'$'),RPAD('GoodBoy',4,'$');
+------------------------+-----------------------+
| RPAD('GoodBoy',12,'$') | RPAD('GoodBoy',4,'$') |
+------------------------+-----------------------+
| GoodBoy$$$$$           | Good                  |
+------------------------+-----------------------+

LTRIM(str)返回已删除str前面空格后的字符串
RTRIM(str) 返回已删除str后面空格后的字符串
TRIM(str)返回已删除str前面及后面空格后的字符串

mysql> SELECT LTRIM('   GoodBoy  ') LTR,length(LTRIM('   GoodBoy  ')) Len_LTR,RTRIM('  GoodBoy  ') RTR,length(RTRIM('  GoodBoy  ')) Len_RTR,TRIM('  GoodBoy  ') TR,length(TRIM('   GoodBoy  ')) Len_TR ;
+-----------+----------+-----------+----------+----------+---------+
| LTR       | Len_LTR  | RTR       | Len_RTR  | TR       | Len_TR |
+-----------+----------+-----------+----------+----------+---------+
| GoodBoy   |        9 |   GoodBoy |        9 | GoodBoy  |       7 |
+-----------+----------+-----------+----------+----------+---------+

MAKE_SET(bits,str1,str2,...) Talk is cheap，show you the code

mysql> SELECT MAKE_SET(18,'a','b','c','d','e','f');
+---------------------------+
| MAKE_SET(18,'a','b','c','d','e','f') |
+---------------------------+
| b,e                       |
+---------------------------+
转换步骤：
1.首先 'a','b','c','d','e','f' 分别对应 2^0,2^1,2^2 ... ，即1，2，4，8，16...，是从低位到高位的顺序。
2.18 = 2 + 16，对应 'b' 和 'e'，返回即可。
3.或者可以这么理解，将18转为2进制，得到 10010 ，从低位到高位则为 01001（颠倒下顺序即可），对应到'a','b','c','d','e','f'上。
'a' 'b' 'c' 'd' 'e' 'f'
 0   1   0   0   1   0
即'b' 'e'。

mysql> SELECT MAKE_SET(18|6,'a','b','c','d','e','f');
+-----------------------------+
| MAKE_SET(18|6,'a','b','c','d','e','f') |
+-----------------------------+
| b,c,e                        |
+-----------------------------+
转换步骤：
此处只是将 18|6 进行了位或 运算
1 0 0 1 0
0 0 1 1 0
---------
1 0 1 1 0
结果 1 0 1 1 0 ，从低位到高位则为 01101（颠倒下顺序即可），对应到'a','b','c','d','e','f'上。
'a' 'b' 'c' 'd' 'e' 'f'
 0   1   1   0   1   0
即 b c e

MATCH()完整表达式 MATCH (col1,col2,...) AGAINST (expr [search_modifier])，全文索引字符搜索，详细介绍见官档：https://dev.mysql.com/doc/refman/5.7/en/fulltext-search.html

mysql> CREATE TABLE articles (
    -> id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
    -> title VARCHAR(200),
    -> body TEXT,
    -> FULLTEXT (title,body)
    -> ) ENGINE=InnoDB;

mysql> INSERT INTO articles (title,body) VALUES
    -> ('MySQL Tutorial','This database tutorial ...'),
    -> ("How To Use MySQL",'After you went through a ...'),
    -> ('Optimizing Your Database','In this database tutorial ...'),
    -> ('MySQL vs. YourSQL','When comparing databases ...'),
    -> ('MySQL Security','When configured properly, MySQL ...'),
    -> ('Database, Database, Database','database database database'),
    -> ('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'),
    -> ('MySQL Full-Text Indexes', 'MySQL fulltext indexes use a ..');

mysql> SELECT * FROM articles
    ->     WHERE MATCH (title,body)
    ->     AGAINST ('database' IN NATURAL LANGUAGE MODE);
+----+------------------------------+-------------------------------+
| id | title                        | body                          |
+----+------------------------------+-------------------------------+
|  6 | Database, Database, Database | database database database    |
|  3 | Optimizing Your Database     | In this database tutorial ... |
|  1 | MySQL Tutorial               | This database tutorial ...    |
+----+------------------------------+-------------------------------+

MID(str,pos,len)为SUBSTRING(str,pos,len)的同义词。见下
SUBSTR(str,pos,len)为SUBSTRING(str,pos,len)的同义词。见下

SUBSTRING(str,pos), SUBSTRING(str FROM pos)
SUBSTRING(str,pos,len), SUBSTRING(str FROM pos FOR len)
1.SUBSTRING()有以上几种形式；
2.FROM pos 的写法是标准SQL语法；
3.pos也可以是负值，即从尾往前定位pos。
4.pos为0或len小于1，则返回空字符串。

mysql> SELECT SUBSTRING('Quadratically',5),SUBSTRING('Quadratically' FROM 5),SUBSTRING('Quadratically',5,3),SUBSTRING('Quadratically',-5),SUBSTRING('Quadratically',-5,4);
+------------------------------+-----------------------------------+--------------------------------+-------------------------------+---------------------------------+
| SUBSTRING('Quadratically',5) | SUBSTRING('Quadratically' FROM 5) | SUBSTRING('Quadratically',5,3) | SUBSTRING('Quadratically',-5) | SUBSTRING('Quadratically',-5,4) |
+------------------------------+-----------------------------------+--------------------------------+-------------------------------+---------------------------------+
| ratically                    | ratically                         | rat                            | cally                         | call                            |
+------------------------------+-----------------------------------+--------------------------------+-------------------------------+---------------------------------+

OCT(N) 返回N的八进制值的字符串表示形式，其中N是一个longlong（BIGINT）数字。这等效于CONV（N，10,8）。如果N为NULL，则返回NULL。

mysql> SELECT OCT(8),CONV(8,10,8),OCT(null);
+--------+--------------+----------+
| OCT(8) | CONV(8,10,8) | OCT(null) |
+--------+--------------+----------+
| 10     | 10           | NULL     |
+--------+--------------+----------+

QUOTE(str)引用字符串以产生可在SQL语句中用作正确转义的数据值的结果。

mysql> SELECT QUOTE('Don\'t!'),QUOTE(NULL),QUOTE('Don\t!');
+---------------+--------------+---------------+
| QUOTE('Don\'t!') | QUOTE(NULL) | QUOTE('Don\t!') |
+---------------+--------------+---------------+
| 'Don\'t!'        | NULL        | 'Don !'         |
+---------------+--------------+---------------+

REPEAT(str,count) 返回一个由重复计数次数count的字符串str组成的字符串。如果count小于1，则返回一个空字符串。如果str或count为NULL，则返回NULL。

mysql> SELECT REPEAT('MySQL', 3),REPEAT('MySQL', -1),REPEAT('MySQL', NULL);
+--------------------+---------------------+-----------------------+
| REPEAT('MySQL', 3) | REPEAT('MySQL', -1) | REPEAT('MySQL', NULL) |
+--------------------+---------------------+-----------------------+
| MySQLMySQLMySQL    |                     | NULL                  |
+--------------------+---------------------+-----------------------+

REPLACE(str,from_str,to_str) 返回字符串str，其中所有出现的字符串from_str都替换为字符串to_str。REPLACE（）执行区分大小写的匹配。

mysql> SELECT REPLACE('www.mysql.com', 'w', 'Qq'),REPLACE('www.mysql.com', 'W', 'Qq'),REPLACE('www.mysql.com', 'w',NULL);
+-------------------------------------+-------------------------------------+------------------------------------+
| REPLACE('www.mysql.com', 'w', 'Qq') | REPLACE('www.mysql.com', 'W', 'Qq') | REPLACE('www.mysql.com', 'w',NULL) |
+-------------------------------------+-------------------------------------+------------------------------------+
| QqQqQq.mysql.com                    | www.mysql.com                       | NULL                               |
+-------------------------------------+-------------------------------------+------------------------------------+

REVERSE(str) 返回str反转后的字符串。

mysql> SELECT REVERSE('GoodBoy');
+--------------------+
| REVERSE('GoodBoy') |
+--------------------+
| yoBdooG           |
+--------------------+

SOUNDEX(str)从str返回一个soundex字符串。
1.发音听起来几乎相同的两个单词应该具有相同的soundex字符串。
2.标准soundex字符串长四个字符，但SOUNDEX（）函数返回任意长的字符串。
3.str中的所有非字母字符都将被忽略。
4.所有A-Z范围以外的国际字母字符都被视为元音。
5.此函数转换时是先丢弃元音，然后再去掉重复字符，属于原始的Soundex算法。增强版本是先去掉重复字符，然后再丢弃元音。
6.函数作用：在做搜寻引擎时面对用户传入的英文字符串，可用本函数做类似模糊比对的效果。

mysql> SELECT SOUNDEX('ladygaga');
+---------------------+
| SOUNDEX('ladygaga') |
+---------------------+
| L320                |
+---------------------+
各字符对应数字的转换规则：
'AEHIOUWY' : 0 
'BFPV'     : 1 
'CGJKQSXZ' : 2 
'DT'       : 3 
'L'        : 4 
'MN'       : 5 
'R'        : 6 
转换步骤：
1.先将对应0的元音字符去掉，得到 'ldgg'；
2.去掉重复字符，得到 'ldg';
3.首字符不变，其他字符转换为对应数字，得到 'l32';
4.长度不够4位，后面补0，得到 'l320';
5.首字符大写，得到最终结果  L320 。

发音相同的单词具有相同的soundex字符串。
mysql> select soundex('Hunt'),soundex('Hant');
+-----------------+-----------------+
| soundex('Hunt') | soundex('Hant') |
+-----------------+-----------------+
| H530            | H530            |
+-----------------+-----------------+

expr1 SOUNDS LIKE expr2 比较expr1的soundex字符串是否等于expr2的soundex字符串，返回布尔值。相同返回1，不同返回0。和表达式 SOUNDEX(str1) = SOUNDEX(str2) 效果一致。

mysql> SELECT 'Hunt' SOUNDS LIKE 'Hant',SOUNDEX('HUNT') = SOUNDEX('HANT'),'GOOD' SOUNDS LIKE 'BOY' ;
+---------------------------+-----------------------------------+--------------------------+
| 'Hunt' SOUNDS LIKE 'Hant' | SOUNDEX('HUNT') = SOUNDEX('HANT') | 'GOOD' SOUNDS LIKE 'BOY' |
+---------------------------+-----------------------------------+--------------------------+
|                         1 |                                 1 |                        0 |
+---------------------------+-----------------------------------+--------------------------+

SPACE(N)返回由N个空格字符组成的字符串。

mysql> SELECT CONCAT('A',SPACE(6),'B');
+--------------------------+
| CONCAT('A',SPACE(6),'B') |
+--------------------------+
| A      B                 |
+--------------------------+

SUBSTRING_INDEX(str,delim,count) 在出现定界符delim之前，从字符串str返回子字符串。
1.如果count为正，则返回最后定界符左侧的所有内容（从左侧开始计数）。
2.如果count为负，则返回最后定界符右边的所有内容（从右边开始计数）。
3.搜索delim时，SUBSTRING_INDEX（）执行区分大小写。

mysql>  SELECT SUBSTRING_INDEX('www.mysql.com', '.', 2),SUBSTRING_INDEX('www.mysql.com', '.', 6),SUBSTRING_INDEX('www.mysql.com', '.', -2);
+------------------------------------------+------------------------------------------+-------------------------------------------+
| SUBSTRING_INDEX('www.mysql.com', '.', 2) | SUBSTRING_INDEX('www.mysql.com', '.', 6) | SUBSTRING_INDEX('www.mysql.com', '.', -2) |
+------------------------------------------+------------------------------------------+-------------------------------------------+
| www.mysql                                | www.mysql.com                            | mysql.com                                 |
+------------------------------------------+------------------------------------------+-------------------------------------------+

WEIGHT_STRING()完整表达式WEIGHT_STRING(str [AS {CHAR|BINARY}(N)] [LEVEL levels] [flags])

WEIGHT_STRING（）是供内部使用的调试函数。 不做描述。

二、字符串比较函数

LIKE() 完整表达式expr LIKE pat [ESCAPE 'escape_char']
1.使用SQL模式进行匹配。返回布尔值，匹配到则为1（TRUE），否则为0（FALSE）；如果expr或pat为NULL，则结果为NULL；

mysql> select 'good' like 'good','good' like 'god','good' like NULL; 
+--------------------+-------------------+------------------+
| 'good' like 'good' | 'good' like 'god' | 'good' like NULL |
+--------------------+-------------------+------------------+
|                  1 |                 0 | NULL             |
+--------------------+-------------------+------------------+

2.默认不区分大小写匹配，如果字符串比较中的任何表达式区分大小写，则以区分大小写的方式执行比较；

SELECT 'abc' LIKE 'ABC','abc' LIKE BINARY 'ABC','abc' LIKE _latin1 'ABC' COLLATE latin1_general_cs;
+------------------+-------------------------+----------------------------------------------------+
| 'abc' LIKE 'ABC' | 'abc' LIKE BINARY 'ABC' | 'abc' LIKE _latin1 'ABC' COLLATE latin1_general_cs |
+------------------+-------------------------+----------------------------------------------------+
|                1 |                       0 |                                                  0 |
+------------------+-------------------------+----------------------------------------------------+

3.LIKE在每个字符的基础上执行匹配，因此它可以产生与=比较运算符不同的结果；

SELECT 'ä' LIKE 'ae' COLLATE utf8mb4_german2_ci,'ä' = 'ae' COLLATE utf8mb4_german2_ci;
+------------------------------------------+---------------------------------------+
| 'ä' LIKE 'ae' COLLATE utf8mb4_german2_ci | 'ä' = 'ae' COLLATE utf8mb4_german2_ci |
+------------------------------------------+---------------------------------------+
|                                        0 |                                     1 |
+------------------------------------------+---------------------------------------+

4.对于非二进制字符串，末尾空格需要参与到比较中。
MySQL8版本中则取决于排序集collations的PAD属性，有以下两个值：
> PAD SPACE 比较字符串时不考虑尾随空格
> NO PAD 比较字符串时考虑尾随空格

mysql> SELECT 'a' = 'a ', 'a' LIKE 'a ';
+------------+---------------+
| 'a' = 'a ' | 'a' LIKE 'a ' |
+------------+---------------+
|          1 |             0 |
+------------+---------------+

5.通配符
% 匹配任意数量的字符，甚至零个字符
_ 精确匹配一个字符

mysql> SELECT 'David!' LIKE '%D%v%','David!' LIKE 'David_','David!!' LIKE 'David_';
+-----------------------+------------------------+-------------------------+
| 'David!' LIKE '%D%v%' | 'David!' LIKE 'David_' | 'David!!' LIKE 'David_' |
+-----------------------+------------------------+-------------------------+
|                     1 |                      1 |                       0 |
+-----------------------+------------------------+-------------------------+

6.要测试通配符的文字实例，请在其前面加上转义符。如果未指定ESCAPE字符，则假定\。
% 匹配一个%字符
_ 匹配一个_字符

mysql> SELECT 'David%' LIKE 'David\%','David_' LIKE 'David\_';
+-------------------------+-------------------------+
| 'David%' LIKE 'David\%' | 'David_' LIKE 'David\_' |
+-------------------------+-------------------------+
|                       1 |                       1 |
+-------------------------+-------------------------+

7.要指定其他转义字符，请使用ESCAPE子句

mysql> SELECT 'David_' LIKE 'David|_' ESCAPE '|';
+------------------------------------+
| 'David_' LIKE 'David|_' ESCAPE '|' |
+------------------------------------+
|                                  1 |
+------------------------------------+

8.作为对标准SQL的扩展，MySQL允许对数字表达式使用LIKE。

mysql> SELECT 10 LIKE '1%';
+--------------+
| 10 LIKE '1%' |
+--------------+
|            1 |
+--------------+

NOT LIKE() 完整表达式expr NOT LIKE pat [ESCAPE 'escape_char']
与NOT（expr LIKE pat [ESCAPE'escape_char']）相同，可参考LIKE用法。
注意字段包含NULL的情况，日常工作中也会经常遇到。
like 的数据量 + not like 的数据量 <> 总量，就是因为字段存在NULL导致。

有表数据如下：
mysql> select * From foo ;
+------+
| bar  |
+------+
| NULL |
| NULL |
+------+
mysql> select count(*) from foo where bar like '%ba%';
+----------+
| count(*) |
+----------+
|        0 |
+----------+
mysql> select count(*) from foo where bar not like '%ba%';
+----------+
| count(*) |
+----------+
|        0 |
+----------+
mysql> select count(*) from foo where bar not like '%ba%' or bar is null;
+----------+
| count(*) |
+----------+
|        2 |
+----------+

STRCMP(expr1,expr2)如果字符串相同，则STRCMP（）返回0；根据当前排序顺序，如果第一个参数小于第二个参数，则返回-1，否则返回1。

mysql> SELECT STRCMP('text', 'text'),STRCMP('text1', 'text2'),STRCMP('text2', 'text1');
+------------------------+--------------------------+--------------------------+
| STRCMP('text', 'text') | STRCMP('text1', 'text2') | STRCMP('text2', 'text1') |
+------------------------+--------------------------+--------------------------+
|                      0 |                       -1 |                        1 |
+------------------------+--------------------------+--------------------------+

指定排序规则的字符串进行比较
mysql> SELECT STRCMP(_latin1 'A' COLLATE latin1_general_ci,_latin1 'a' COLLATE latin1_general_ci),STRCMP(_latin1 'A' COLLATE latin1_general_cs,_latin1 'a' COLLATE latin1_general_cs);
+-------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------+
| STRCMP(_latin1 'A' COLLATE latin1_general_ci,_latin1 'a' COLLATE latin1_general_ci) | STRCMP(_latin1 'A' COLLATE latin1_general_cs,_latin1 'a' COLLATE latin1_general_cs) |
+-------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------+
|                                                                                   0 |                                                                                  -1 |
+-------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------+

三、正则表达式

见链接 https://www.jianshu.com/p/cc18fd228e88

四、字符集和排序规则函数

1.简单字符串函数返回的值的字符集与输入字符串的字符集相同；如 INSTR(), LCASE(), LOWER(), LTRIM(), MID(), REPEAT(), REPLACE(), REVERSE(), RIGHT(), RPAD(), RTRIM(), SOUNDEX(), SUBSTRING(), TRIM(), UCASE(), and UPPER()等。
2.与所有其他函数不同，REPLACE（）函数始终忽略字符串输入的排序规则，并执行区分大小写的比较。
3.对于多个输入字符串（多个字符集），一个输出字符串的情形，满足以下规则：
> 如果明确COLLATE 为Y，则返回COLLATE 为Y；
> 如果明确COLLATE 为Y 和 Z，则抛出错误；
> 否则，如果所有COLLATE 为Y，则返回COLLATE 为Y；
> 否则，返回的结果集没有COLLATE。

例如，使用CASE ... WHEN a THEN b WHEN b THEN c COLLATE X END，所得的排序规则为X。同样适用于UNION，||，CONCAT（），ELT（），GREATEST（），IF（）和LEAST（）。

4.对于转换为字符数据的操作，这些操作产生的字符串的字符集和排序规则由character_set_connection和collation_connection系统变量定义，这些系统变量确定默认的连接字符集和排序规则。仅适用于CAST（），CONV（），FORMAT（），HEX（）和SPACE（）。
5.从MySQL 5.7.19开始，虚拟生成的列的表达式是以上规则的例外情况。在这样的表达式中，表默认的字符集用于CONV（）或HEX（）的结果，而与连接字符集（character_set_connection和collation_connection）无关。
5.使用CHARSET()或collation()函数查找所属字符集。

mysql> SELECT CHARSET('a'),CHARSET(BINARY 'a'),CHARSET(COMPRESS('abc')), COLLATION(COMPRESS('abc'));
+--------------+---------------------+--------------------------+----------------------------+
| CHARSET('a') | CHARSET(BINARY 'a') | CHARSET(COMPRESS('abc')) | COLLATION(COMPRESS('abc')) |
+--------------+---------------------+--------------------------+----------------------------+
| utf8mb4      | binary              | binary                   | binary                     |
+--------------+---------------------+--------------------------+----------------------------+

MySQL字符串函数及使用

目录：

一、字符串常规函数

二、字符串比较函数

三、正则表达式

四、字符集和排序规则函数

一、字符串常规函数

二、字符串比较函数

三、正则表达式

四、字符集和排序规则函数

你可能感兴趣的:(MySQL字符串函数及使用)