正则表达式的使用

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

我们可以使用regexper图形工具理解表达式的含义。


元字符

元字符是正则表达式中有特殊含义的非字母字符,包括:.*+?^.\|(){}[]


修正符

模式修正符就是几个字母,我们在每个正则表达式中可以一次使用一个,也可以连续使用多个,每一个具一定的意义。
模式修正符是对整个正则表达式调优使用,也可以说是对正则表达式功能的扩展。
常用的模式修正符有i、g、m等。

字符 含义 默认值
i 忽略大小写 false
g 全局匹配 false
m 多行匹配 false

字符类

所谓类是指符合某些特性的对象,一个泛指,而不是特指某个字符。
我们可以使用元字符[]来构建一个简单的类,如表达式[abc]。
使用元字符^创建反向类/负向类,意思是不属于某类的内容,如表达式[^abc]表示不是字符a或b或c的内容


范围类

我们可以使用[a-z]来连接两个字符,表示从a到z的任意字符。


预定义类

字符 等价类 含义
. [^\r\n] 除回车符和换行符之外所有字符
\d [0-9] 数字字符
\D [^0-9] 非数字字符
\s [\t\n\x0B\f\r] 空白符
\S [^\t\n\x0B\f\r] 非空白符
\w [a-zA-Z_0-9] 单词字符(字符数字下划线)
\W [^a-zA-Z_0-9] 非单词字符

边界

// JavaScript语法
'This is a dog'.replace(/\b\is\b/g, 'IS'); // 输出 This IS a dog

常用的边界匹配字符

字符 含义
^ 以xx开始
$ 以xx结束
\b 单词边界
\B 非单词边界

量词

// \d{8}表示数字匹配8次
'123456789'.replace(/\d{8}/g, 'X'); // 输出X9
字符 含义
? 出现零次或一次(最多一次)
+ 出现一次或多次(至少一次)
* 出现零次或多次(任意次数)
{n} 出现n次
{n, m} 出现n到m次
{n,} 至少出现n次

贪婪模式

// 默认会尽可能多的满足匹配条件(贪婪模式)
'12345678'.replace(/\d{3,6}/g, 'X'); // 输出 X78

// 加?会尽可能少的满足匹配条件(非贪婪模式)
'12345678'.replace(/\d{3,6}?/g, 'X'); // 输出 XX78

分组

若想匹配一个字母加一个数字连续出现3次的情况,使用[a-z]\d{3}是不行的。
需要用()进行分组,用于如([a-z]\d){3}表示a1b2c3这种情况。


表达式,符号是|

'ByronsperByrCasper'.replace(/Byr(on|Ca)sper/g, 'X'); // 输出 XX

反向引用

$需要配合分组()使用

'2017-08-02'.replace(/(\d{4})-(\d{2})-(\d{2})/g, '$2/$3/$1'); // 输出 08/02/2017

不需要捕获的某些分组,只需要在分组内加上?:即可。

前瞻

正则表达式从文本头部向尾部开始解析,文本尾部方向,称为'前'

前瞻:就是在正则表达式匹配到规则的时候,向前检查是否符合断言,后顾/后瞻方向相反。

符合和不符合特定断言称为正向匹配负向匹配

名称 正则 含义
正向前瞻 exp(?=assert) 匹配后面满足表达式exp的位置
负向前瞻 exp(?!assert) 匹配后面不满足表达式exp的位置
正向后顾 exp(?<=assert) 匹配前面满足表达式exp的位置(JS不支持)
负向后顾 exp(? 匹配前面不满足表达式exp的位置(JS不支持)
'a2*3'.replace(/\w(?=\d)/g, 'X'); // 输出 X2*3

对象属性

  • global: 是否全文搜索,默认false
  • ignoreCase : 大小写敏感,默认false
  • multiline: 多行搜索,默认false
  • lastIndex : 下一个匹配项的开始位置,开始为0
  • source : 正则表达式的文本字符串
var reg = /\d{3,6}/g
console.log(reg.global) // 输出true

你可能感兴趣的:(正则表达式的使用)