Web--JavaScript正则表达式

  • 前言
  • 一、五种正则表达式编写方法
    • 1.1 match()
    • 1.2 test()
    • 1.3 search()
    • 1.4 replace()
    • 1.5 replaceAll()
  • 二、匹配规则
    • 2.1 常用匹配规则
    • 2.2 正则表达式量词
    • 2.3 RegExp对象的exec()方法
  • Reference

前言

正则表达式(Regular Expression)是一门简单语言的语法规范,是强大、便捷、高效的文本处理工具,它应用在一些方法中,对字符串中的信息实现查找、替换和提取操作。在本文中,将介绍一些 JavaScript 中的编写正则表达式的常见用法。

一、五种正则表达式编写方法

1.1 match()

match() 与字符串一起使用以检查字符串和正则表达式 regex 之间的匹配,以正则表达式为参数。
语法:

str.match(regex);

方法返回 3 个可能的值:

  • 如果正则表达式包含一个 g 标记,即为全局匹配,它将返回一个包含所有匹配项的数组,没捕获组信息;
  • 如果正则表达式没有 g 标记,它将返回一个包含第一个匹配项和其相关的捕获组的数组;
  • 如果根本没有匹配项,则返回 null 。

groups:一个命名捕获组的对象,其键是名称,值为捕获组,如果未定义命名捕获组,则为 undefined。

带有标记 g 的实例代码:

const strText = "Hello China";
const regex = /[A-Z]/g; // 大写字母正则表达式
console.log(strText.match(regex)); // [ 'H', 'C' ]

没有标记 g 的实例代码:

const text = 'Hello World';
const regex = /[A-Z]/; //Capital letters regex.
console.log(text.match(regex)); // [ 'H', index: 0, input: 'Hello China', groups: undefined ]

当没有匹配的实例代码:

const strText = "hello china";
const regex = /[A-Z]/; // 大写字母正则表达式
console.log(strText.match(regex)); // null

1.2 test()

test() 用于测试指定字符串和正则表达式之间是否匹配,接受一个字符串作为其参数,并根据是否匹配返回 true 或 false 。

假设在下面的字符串 strText 中检测单词 china 是否存在。可以为查找单词创建一个正则表达式并测试该正则表达式和字符串 strText 之间是否匹配。
(插入题外话:如果有个变量声明为:var regex = / / JS不会报错,这里表示声明一个正则表达式)

const strText = "hello china";
const regex = /china/;
console.log(regex.test(strText)); // true

下面是没有匹配的实例代码:

const strText = "hello China";
const regex = /china/;
console.log(regex.test(strText)); // false

从上面代码可以看到,大小写是会影响匹配的结果,如果需要忽略大小写,则需要使用标记 i,如下代码:

const strText = "hello China";
const regex = /china/i;
console.log(regex.test(strText)); // true

请注意,在语法上 .match() 与 .test() 在使用上是 “相反” 的

1.3 search()

search() 方法是一个字符串方法,可以将其与正则表达式一起使用。可以将正则表达式作为参数传递给它,以在字符串中搜索匹配项。

方法返回第一个匹配项在整个字符串中的位置(索引),如果没有匹配项,则返回 -1。

匹配的实例:

const strText = "hello china,i love china";
const regex = /china/;
console.log(strText.search(regex)); // 6

没有匹配的实例:

const strText = "hello china,i love china";
const regex = /devpoint/;
console.log(strText.search(regex)); // -1

1.4 replace()

replace() 是在字符串中搜索指定的值或正则表达式并将其替换为另一个值,方法接受两个参数:

  1. 要搜索的值
  2. 要替换的新值

方法返回一个包含被替换后的新字符串,需要注意的是,它不会改变原始字符串,并且只会替换搜索到的第一个值。

实例代码:

const strText = "hello world,i love world";
const regex = /world/;
console.log(strText.replace(regex, "china")); // hello china,i love world

1.5 replaceAll()

replaceAll() 类似于方法 replace() ,但它允许替换字符串中所有匹配的值或正则表达式。

它接受两个参数:

  1. 要搜索的值,如果是正则,则必须带上全局标记 g
  2. 要替换的新值

它返回一个包含所有新值的新字符串,同样也不会更改原始字符串。

实例代码:

const strText = "hello world,i love world";
const regex = /world/g;
console.log(strText.replaceAll(regex, "china")); // hello china,i love china

等效于如下代码:

const strText = "hello world,i love world";
console.log(strText.replaceAll("world", "china")); // hello china,i love china

通过正则查找替换,在正则表达式中加上全局标记 g , 同样可以替换所有符合正则条件的字符串,如下代码:

const strText = "hello world,i love world";
const regex = /world/g;
console.log(strText.replace(regex, "china")); // hello china,i love china

二、匹配规则

2.1 常用匹配规则

\d可以匹配一个数字                
\w可以匹配一个字母或数字      
\s可以匹配一个空格(也包括Tab等空白符)
\DWS都是表示匹配与小写字母相反的匹配关系
\数字n表示指向第n个分组捕获到的字符串文本的一个引用,能够再次被匹配       
.可以匹配任意字符 
A|B可以匹配AB 
^表示行的开头          ^\d表示必须以数字开头
$表示行的结束          \d$表示必须以数字结束
[]表示范围,字符类                          
[a-zA-Z\_\$][0-9a-zA-Z\_\$]*可以匹配由字母或下划线、$开头,后接任意个由一个数字、字母或者下划线、$组成的字符串,也就是JavaScript允许的变量名
[a-zA-Z\_\$][0-9a-zA-Z\_\$]{0, 19}更精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)
[] 中的^ 表示排除某个字符     [^#?] 表示除了?和#的所有字符     
()表示捕获型分组,可以将匹配的字符串进行分组,提取子串                 

2.2 正则表达式量词

*表示任意个字符(包括0个)
+表示至少一个字符
?表示0个或1个字符
{n}表示n个字符
{n,m}表示n-m个字符 

2.3 RegExp对象的exec()方法

如果正则表达式中定义了组,就可以在RegExp对象上用exec()方法提取出子串来。
exec()匹配成功后,返回一个Array,第一个元素是正则表达式匹配到的整个字符串,后面的字符串表示匹配成功的子串。
exec()匹配失败时返回null。

^(\d{3})-(\d{3,8})$分别定义了两个组,可以直接从匹配的字符串中提取出区号和本地号码:

var re = /^(\d{3})-(\d{3,8})$/;
re.exec('010-12345'); // ['010-12345', '010', '12345']
re.exec('010 12345'); // null 

(?:) 分组不想被捕获的时候使用,可以提高程序执行速度,非捕获型分组不会干扰捕获型分组编号。
案例:

var str = "a1***ab1cd2***c2";
var reg1 = /((ab)+\d+)((cd)+\d+)/i;
var reg2 = /((?:ab)+\d+)((?:cd)+\d+)/i;
console.log(reg1.exec(str)); //["ab1cd2", "ab1", "ab", "cd2", "cd", index: 5, input: "a1***ab1cd2***c2", groups: undefined]
console.log(str.match(reg2)); //["ab1cd2", "ab1", "cd2", index: 5, input: "a1***ab1cd2***c2", groups: undefined]

用正则表达式切分字符串比用固定的字符更灵活

'a,b;; c d'.split(/[\s\,\;]+/); // ['a', 'b', 'c', 'd']  

Reference

[1] 5种JavaScript 正则表达式的方法(公众号文章->名称: web前端开发(ID : web_qdkf ))
[2] JavaScript中怎么利用正则表达式判断匹配规则. https://www.yisu.com/zixun/187736.html
[3] JS正则表达式之非捕获分组用法实例分析. https://www.jb51.net/article/101454.htm

你可能感兴趣的:(Web,javascript,前端,正则表达式)