JS正则基础整理

Regular Expression 正则表达式是指:

使用单个字符串来描述或者匹配一系列符合某个句法规则的字符串。

在JS中正则有两种表达方式:

1. 字面量 var reg = /\b$/g

2. 构造函数 var reg = new RegExp('\\b$','g')

上面字面量或者构造函数中包含的g为正则表达式中的修饰符,修饰符包括:

1. g:global代表全文搜索,不添加,则匹配到第一个之后就停止

2. i:ignore case代表忽略大小写,默认对大小写敏感

3. m:multiple lines代表多行搜索

接下来介绍正则中比较特殊的字符:

\t 水平制表符

\v 垂直制表符

\n 换行符

\r 回车符

\0 空字符

\f 换页符

\cX 与X对应的控制字符 e.g. Ctrl+X

接下来我们来看正则表达式怎么书写,一般情况下

正则表达式的一个字符对应字符串中的一个字符

abc\t 

表示字符abc再加上一个水平制表符

abc\t

[abc]\t

[]代表类,类表示泛指,所以表达式表示abc中任意一个,再加一个水平制表符

[abc]\t

[^abc]\t

对于类,我们是可以通过^取反的,所以表达式表示不是abc中任意一个,再加一个水平制表符

[^abc]\t

[a-z]

如果我们要创建一个24个小写字母的类,依据上面的方法,我们可以把24个字母都写到[]中,但这样很冗杂,所以就有了范围类,所以表达式表示a到z中任意一个小写字母,包含a和z

[a-z]

有一些常用的类被预先定义了,称为预定义类,用起来比较方便

字符 | 等价类 | 含义

.  [^\n\r] 除了回车和换行符以外的所有字符

\d  [0-9] 数字字符

\D  [^0-9] 非数字字符

\s  [\t\n\x0B\f\r] 空白符

\S  [^\t\n\x0B\f\r] 非空白符

\w  [a-zA-Z_0-9] 单词字符,包括:字母、数字、下划线

\W  [^a-zA-Z_0-9] 非单词字符

[abc]\d

表示匹配abc中任意一个,再加一个数字

[abc]\d

上面的举例都是一个字符一个字符的匹配,万一需要匹配的字符串很长,比如说需要连续出现10个数字字符,那我们应该怎样去写比较方便呢?

\d{10}

表示数字出现10次

\d{10}

像这样的量词,正则中有如下规定:

字符 | 含义

?  出现一次或没有,最多一次

+  出现一次或更多,至少一次

*  没有或出现多次,出现任意次

{n}  出现n次

{n,m}  出现n到m次

{n,}  至少出现n次

abc\b

表示abc后面匹配一个位置,这个位置为单词边界,所谓单词边界指:一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“\b”是零宽度的。

abc\b

正则还提供了一些边界匹配字符

字符 | 含义

^  以xxx开始

$  以xxx结尾

\b  单词边界

\B  非单词边界

学会了书写,接下来我们来看匹配,匹配有贪婪模式匹配,和非贪婪模式匹配,非贪婪模式指让正则表达式尽可能的少匹配,一旦匹配成功就不再继续尝试匹配,而贪婪模式刚好相反

要实现非贪婪模式匹配,就在两次后面加上?就可以了

非贪婪模式和贪婪模式

abc{3}

abc{3}

(abc){3}

(abc){3}

使用()可以进行分组

wendy(S|Q)

wendy(S|Q)

可以使用|代表或者的意思

JS中用的比较多的方法在这儿列举一下:

reg.test('123') 如果符合规则返回true,否则返回false

'123'.match(/\d{1,2}/g) 返回匹配到的结果,若有则为数组,否则为null

'2017-10-07'.replace(/(\d{4})-(\d{2})-(\d{2})/g,'$2'+'-'+'$3'+'-'+'$1')

replace方法

若是不想捕获某一个分组,可以在分组加上?: 即可

replace不捕获某一分组

最后,推荐一个正则表达式的分析工具https://regexper.com/#wendy(S%7CQ)

你可能感兴趣的:(JS正则基础整理)