学习来源:腾讯课堂-Javascript正则表达式基础
学习代码:https://github.com/GemmaYin/RegExp
4-基础-字符串和RegExp的方法-test
// reg.test(str) 返回true/false,表示是否匹配成功
var str = 'aaaabc abcd addd sgd abbccb ac'
var str2 = 'ssdsss'
var reg = new RegExp("a(b*)c");
console.log(reg.test(str)) // true
console.log(reg.test(str2)) // false
5-基础-字符串和RegExp的方法-match
// str.match(reg),与reg.exec相似,但是若使用g选项,则str.match一次性返回所有结果
var str = 'aaaabc abcd addd sgd abbccb ac'
console.log(str.match(/a(b*)c/)) // ["abc", "b", index: 3, input: "aaaabc abcd addd sgd abbccb ac"]
console.log(str.match(/a(b*)c/g)) // ["abc", "abc", "abbc", "ac"]
7-基础-字符串和RegExp的方法-str.replace
// str.search(reg),返回匹配成功的第一个位置
var str = 'aaacabc abcd addd sgd abbccb ac'
// 老的方式:不会改变原来的值,而且只替换第一个
var str2 = str.replace('c','x')
console.log(str) // aaacabc abcd addd sgd abbccb ac
console.log(str2) // aaaxabc abcd addd sgd abbccb ac
// 正则:str.replace(reg,newstr)用第一个参数reg去匹配,用第二个参数newstr去替换
console.log(str.replace(/c/g,'x')) // aaaxabx abxd addd sgd abbxxb ax
8-基础-字符串和RegExp的方法-str.split
// str.search(reg),返回匹配成功的第一个位置
var str = 'abcabbccdecdefg'
// 老的方式:按照字母b来切割
console.log(str.split('b')) // ["a", "ca", "", "ccdecdefg"]
// 正则:str.split(reg,[maxLength])用匹配的模式切割,第二个参数是限制返回结果的最大数量
// 用一个b或者多个b来切割
console.log(str.split(/b+/)) // ["a", "ca", "ccdecdefg"]
var str2 = 'abc abbs dd sss'
//用一个或者多个空格来切
console.log(str2.split(/\s+/)) // ["abc", "abbs", "dd", "sss"]
// 最多返回两个
console.log(str2.split(/\s+/,2)) // ["abc", "abbs"]
9-基础-i 选项
// i表示忽略大小写
var str = 'abc Abc abCD 123'
console.log(str.match(/abc/g)) // ["abc"]
console.log(str.match(/abc/gi)) // ["abc", "Abc", "abC"]
console.log(str.match(/abc/ig)) // ["abc", "Abc", "abC"]
10-基础-次数
var str1 = 'abc Abc abCD 123'
// 1. {n} 前面的一个表达式正好出现n次 a正好出现2次
console.log(str1.match(/a{2}b/gi)) // null
console.log(str1.match(/a{1}b/gi)) // ["ab", "Ab", "ab"]
// 2. {n,m} 前面的一个表达式至少出现n次,最多m次
var str2 = 'aAcbc Abc abCD 123 fAaBCfd'
console.log(str2.match(/a{1,2}b/gi)) // ["Ab", "ab", "AaB"]
// 3. {n,} 匹配前面的一个表达式至少出现n次
var str3 = 'aAcbc Abc aaaabCD 123'
console.log(str2.match(/a{2,}b/gi)) // ["aaaab"]
// + 表示 至少出现1次 ,等于 {1,}
console.log(str3.match(/a{1,}b/gi)) // ["Ab", "aaaab"]
console.log(str3.match(/a+b/gi)) // ["Ab", "aaaab"]
// 4. ? 匹配前面的一个表达式 0次或1次,等价于{0,1}
var str4 = 'aAcbc Abc aaaabCD 123'
console.log(str4.match(/a?b/gi)) // ["b", "Ab", "ab"]
// 如果 ? 紧跟在任何量词 (* + ? {})的后面,将会使量词变为非贪婪的,默认是贪婪的
var str5 = "ad 2 34 cd55;s;d;d555";
console.log(str5.match(/\d+/g)) // ["2", "34", "55", "555"]
console.log(str5.match(/\d+?/g)) // ["2", "3", "4", "5", "5", "5", "5", "5"]
// 5. * 匹配前一个表达式0次或多次,(有没有都行),等价于{0,}
// var str5 = 'aAcbc Abc aaaabCD 123'
// console.log(str5.match(/a*b/gi)) // ["b", "Ab", "aaaab"]
11-特殊字符-1
/** 1.1 正常字符前面如果有\,表示这个字符是特殊的,而不是原来的含义。如:b表示b, 但\b表示单词边界
/B 表示非边界
**/
let str = 'hello world helloword wordhello'
console.log(str.match(/hello/g)) // ["hello", "hello", "hello"]
console.log(str.match(/\bhello\b/g)) // ["hello"]
console.log(str.match(/hello\b/g)) // ["hello", "hello"]
console.log(str.match(/\Bhello/g)) // ["hello"]
// 1.2 特殊字符前面加了\,则特殊字符变为普通字符。如:*表示0个或多个,但\*就表示星号*
let str2 = 'a*bc'
console.log(str2.match(/a\*/g)) // ["a*"]
// 1.3 使用new RegExp 方式时,因其第一个参数是字符串,所以想使用\做转义时,要写\\
var str3 = "ad 2 34 cd55;s;d;d555"
var input = 'd'
var reg2 = new RegExp('\\' + input + '+','g')
document.write("
")
document.write(str3.match(reg2))
// 1.4 \d数字 \D非数字
var str4 = '45abc78dddd'
console.log(str4.match(/\d+/g)) // ["45", "78"]
console.log(str4.match(/\D+/g)) // ["abc", "dddd"]
11-特殊字符-2
// 1. ^ 匹配输入的开始,如果是多行模式,则可以匹配一行的开始
// 2. $ 匹配输入的结束,如果是多行模式,则可以匹配一行的结束
// 3. 当^作为第一个字符出现在一个字符集合模式时,它将会有不同的含义,如[^...]
// 4. . 匹配除了换行以外的任何一个字符
let str = 'abbc abc adfc afc'
let str2 = 'abbc abc adfc vvv'
console.log(str.match(/a.c/g)) // ["abc", "afc"]
console.log(str.match(/a.+c/g)) // ["abbc abc adfc afc"]
console.log(str2.match(/a.+c/g)) // ["abbc abc adfc"]
// 5. (x)分组:匹配x并记住,()称为捕获括号
// 5.1 不加括号只匹配一个字母,加括号可以匹配一组
let str3 = 'fredd'
console.log(str3.match(/d+/)) // ["dd", index: 3, input: "fredd", groups: undefined]
let str4 = 'fredd fredd'
console.log(str3.match(/(fred)+/)) // ["fred", "fred", index: 0, input: "fredd", groups: undefined]
/** 5.2 使用括号里的模式对目标进行匹配,并且把结果存在\1...\n中,
在接下来的模式表达式中可以使用\1...\n来代替前面匹配到的结果
**/
let str5 = 'foo bar foo bar'
console.log(str5.match(/(foo) (bar) (foo) (bar)/)) // ["foo bar foo bar", "foo", "bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
console.log(str5.match(/(foo) (bar) \1 \2/)) // ["foo bar foo bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
console.log(str5.match(/(foo) (bar) (\1) (\2)/)) // ["foo bar foo bar", "foo", "bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
// foxxxfoo
console.log(str5.match(/(.)o.*\1oo/)) // ["foo bar foo", "f", index: 0, input: "foo bar foo bar", groups: undefined]
console.log('abcabc'.match(/(.)b(.)/)) // ["abc", "a", "c", index: 0, input: "abcabc", groups: undefined]
console.log('-----')
console.log('abcabc'.match(/(.)b(.)(.)b(.)/)) // ["abcabc", "a", "c", "a", "c", index: 0, input: "abcabc", groups: undefined]
console.log('abcabc'.match(/(.)b(.)\1b\2/)) // ["abcabc", "a", "c", index: 0, input: "abcabc", groups: undefined]
console.log('abcfbc'.match(/(.)b(.)(.)b(.)/)) // ["abcfbc", "a", "c", "f", "c", index: 0, input: "abcfbc", groups: undefined]
console.log('abcfbc'.match(/(.)b(.)\1b\2/)) // null
// 5.3 replace 替换时使用分组信息不再是\ 而是 $n
let str6 = 'hello worlde' // 目标: worlde hello
// /w 表示 字母 数字 下划线 汉字
console.log(str6.replace(/(\w+) (\w+)/, "$2 $1")) // worlde hello
/** 5.4 分组捕获时如果再使用/g,则match操作不会捕获分组,
如果必须使用/g 可以使用reg.exec(str)
**/
console.log(str6.match(/(l+)/g)) // ["ll", "l"]
let reg = new RegExp("e", "g")
console.log(reg.exec(str6)) // ["e", index: 1, input: "hello worlde", groups: undefined]
console.log(reg.exec(str6)) // ["e", index: 11, input: "hello worlde", groups: undefined]
console.log(reg.exec(str6)) // null
let reg2 = new RegExp("(e)", "g")
console.log(reg2.exec(str6)) // ["e", "e", index: 1, input: "hello worlde", groups: undefined]
console.log(reg2.exec(str6)) // ["e", "e", index: 11, input: "hello worlde", groups: undefined]
// 5.5 (?:x) 匹配但不记住,称为非捕获括号,因为分组只有9个
let str1 = 'foo'
console.log(str1.match(/(foo){1,2}/)) // ["foo", "foo", index: 0, input: "foo", groups: undefined]
console.log(str1.match(/(?:foo){1,2}/)) // ["foo", index: 0, input: "foo", groups: undefined]
11-特殊字符-3
// 1. x(?=y) 匹配x并且后面必须是y
let str1 = 'foo fox'
let str2 = 'fof fox'
console.log(str1.match(/fo(?=o)/)) // ["fo", index: 0, input: "foo fox", groups: undefined]
console.log(str2.match(/fo(?=x)/)) // ["fo", index: 4, input: "fof fox", groups: undefined]
// 2. x(?!y) 匹配x并且后面必须不是y
let str3 = 'fop fon'
console.log(str3.match(/fo(?!p)/)) // ["fo", index: 4, input: "fop fon", groups: undefined]
console.log(str3.match(/fo(?!n)/)) // ["fo", index: 0, input: "fop fon", groups: undefined]
// 3. x|y 匹配x或者y
console.log(str3.match(/fo(p|n)/)) // ["fop", "p", index: 0, input: "fop fon", groups: undefined]
console.log(str3.match(/fo(p|n)/g)) // ["fop", "fon"]
// 4. [] 或者
// 4.1 [xyz] x或者y或者z
let str4 = 'foao fax'
console.log(str4.match(/f[oax]/g)) // ["fo", "fa"]
// 4.2 范围:[0-9],[a-z],[a-zA-Z0-9]
let str5 = 'a28bc'
console.log(str5.match(/a[0-9]+b/g)) // ["a28b"]
console.log(str5.match(/a[0-9]{1,2}[a-z]/g)) // ["a28b"]
// 4.3 [12-89] 1或者2 到 8或者9
let str6 = '029'
console.log(str6.match(/[12-89]/)) // ["2", index: 1, input: "029", groups: undefined]
// [^xyz] 中括号前^ 表示非,不是x不是y,不是z
let str7 = 'abcde'
console.log(str7.match(/a[^xy]c/)) // ["abc", index: 0, input: "abcde", groups: undefined]
12 .案例
/** 1. 匹配电话
第一位:1 第二位: 34578 剩余九位数字
**/
let reg = /1[34578]\d{9}/
console.log(reg.test('15789456123')) // true
console.log(reg.test('1578945612c')) // false
let str = '姓名:小尹 手机:15789456123 性别:女'
console.log(str.replace(reg, '***')) // 姓名:小尹 手机:*** 性别:女
// 2. 网页标签
let str2 = 'sdsdsdf dss'
let reg2 = /<(.+)>.*<\/\1>/
let reg3 = /<(.+)>(.*)<\/\1>/
console.log(str2.match(reg2)) // ["", "div", index: 8, input: "sdsdsdf dss", groups: undefined]
console.log(str2.match(reg3)) // ["", "div", "[email protected]", index: 8, input: "sdsdsdf dss", groups: undefined]
// 3. 敏感词替换
let str3 = '中国共产党中国人民解放军中国'
console.log(str3.replace(/中国|军/g, '*')) // *共产党*人民解放**
let result = str3.replace(/中国|军/g, input => {
let t = ''
for(let i = 0; i < input.length; i++) {
t += '*'
}
return t
})
console.log(result) // **共产党**人民解放***
// 4. 去首尾空格
let str4 = ' 你好 怎么样 '
console.log(str4.replace(/^\s+|\s+$/g, '')) // 你好 怎么样
// 5. 千位分隔符
let str5 = '1234567890123456'
console.log(str5.replace(/(\d)(?=(?:\d{3})+$)/g, '$1,')) // 1,234,567,890,123,456