JS正则笔记

学习来源:腾讯课堂-Javascript正则表达式基础
学习代码:https://github.com/GemmaYin/RegExp

4-基础-字符串和RegExp的方法-test

    // reg.test(str) 返回true/false,表示是否匹配成功
    var str = 'aaaabc abcd addd sgd abbccb ac'
    var str2 = 'ssdsss'
    var reg = new RegExp("a(b*)c");
    console.log(reg.test(str)) // true
    console.log(reg.test(str2)) // false

5-基础-字符串和RegExp的方法-match

    // str.match(reg),与reg.exec相似,但是若使用g选项,则str.match一次性返回所有结果
    var str = 'aaaabc abcd addd sgd abbccb ac'

    console.log(str.match(/a(b*)c/)) // ["abc", "b", index: 3, input: "aaaabc abcd addd sgd abbccb ac"]
    console.log(str.match(/a(b*)c/g)) // ["abc", "abc", "abbc", "ac"]

7-基础-字符串和RegExp的方法-str.replace

    // str.search(reg),返回匹配成功的第一个位置
    var str = 'aaacabc abcd addd sgd abbccb ac'

// 老的方式:不会改变原来的值,而且只替换第一个
    var str2 = str.replace('c','x')
    console.log(str)  // aaacabc abcd addd sgd abbccb ac
    console.log(str2)  // aaaxabc abcd addd sgd abbccb ac

//  正则:str.replace(reg,newstr)用第一个参数reg去匹配,用第二个参数newstr去替换
    console.log(str.replace(/c/g,'x')) // aaaxabx abxd addd sgd abbxxb ax

8-基础-字符串和RegExp的方法-str.split

    // str.search(reg),返回匹配成功的第一个位置
    var str = 'abcabbccdecdefg'

// 老的方式:按照字母b来切割
    console.log(str.split('b'))  // ["a", "ca", "", "ccdecdefg"]

//  正则:str.split(reg,[maxLength])用匹配的模式切割,第二个参数是限制返回结果的最大数量
    // 用一个b或者多个b来切割
    console.log(str.split(/b+/)) // ["a", "ca", "ccdecdefg"]

    var str2 = 'abc abbs     dd sss'
    //用一个或者多个空格来切
    console.log(str2.split(/\s+/)) // ["abc", "abbs", "dd", "sss"]
    // 最多返回两个
    console.log(str2.split(/\s+/,2)) // ["abc", "abbs"]

9-基础-i 选项

    // i表示忽略大小写
    var str = 'abc Abc abCD 123'

    console.log(str.match(/abc/g)) // ["abc"]
    console.log(str.match(/abc/gi)) // ["abc", "Abc", "abC"]
    console.log(str.match(/abc/ig)) // ["abc", "Abc", "abC"]

10-基础-次数

    var str1 = 'abc Abc abCD 123'

    // 1. {n} 前面的一个表达式正好出现n次  a正好出现2次
    console.log(str1.match(/a{2}b/gi)) // null
    console.log(str1.match(/a{1}b/gi)) // ["ab", "Ab", "ab"]

    // 2. {n,m} 前面的一个表达式至少出现n次,最多m次
    var str2 = 'aAcbc Abc abCD 123 fAaBCfd'
    console.log(str2.match(/a{1,2}b/gi)) // ["Ab", "ab", "AaB"]

    // 3. {n,} 匹配前面的一个表达式至少出现n次
    var str3 = 'aAcbc Abc aaaabCD 123'
    console.log(str2.match(/a{2,}b/gi)) // ["aaaab"]

    // + 表示 至少出现1次 ,等于 {1,}
    console.log(str3.match(/a{1,}b/gi)) // ["Ab", "aaaab"]
    console.log(str3.match(/a+b/gi)) // ["Ab", "aaaab"]

    // 4. ? 匹配前面的一个表达式 0次或1次,等价于{0,1}
    var str4 = 'aAcbc Abc aaaabCD 123'
    console.log(str4.match(/a?b/gi)) // ["b", "Ab", "ab"]

    // 如果 ? 紧跟在任何量词 (* + ? {})的后面,将会使量词变为非贪婪的,默认是贪婪的
    var str5 = "ad 2 34 cd55;s;d;d555";
    console.log(str5.match(/\d+/g)) // ["2", "34", "55", "555"]
    console.log(str5.match(/\d+?/g)) // ["2", "3", "4", "5", "5", "5", "5", "5"]

    // 5. * 匹配前一个表达式0次或多次,(有没有都行),等价于{0,}
    // var str5 = 'aAcbc Abc aaaabCD 123'
    // console.log(str5.match(/a*b/gi)) // ["b", "Ab", "aaaab"]

11-特殊字符-1

  /** 1.1 正常字符前面如果有\,表示这个字符是特殊的,而不是原来的含义。如:b表示b, 但\b表示单词边界
      /B 表示非边界
  **/
  let str = 'hello world helloword wordhello'
  console.log(str.match(/hello/g)) // ["hello", "hello", "hello"]
  console.log(str.match(/\bhello\b/g)) // ["hello"]
  console.log(str.match(/hello\b/g)) // ["hello", "hello"]
  console.log(str.match(/\Bhello/g)) // ["hello"]

  // 1.2 特殊字符前面加了\,则特殊字符变为普通字符。如:*表示0个或多个,但\*就表示星号*
  let str2 = 'a*bc'
  console.log(str2.match(/a\*/g)) // ["a*"]

  // 1.3 使用new RegExp 方式时,因其第一个参数是字符串,所以想使用\做转义时,要写\\
    var str3 = "ad 2 34 cd55;s;d;d555"
    var input = 'd'
    var reg2 = new RegExp('\\' + input + '+','g')
    document.write("
") document.write(str3.match(reg2)) // 1.4 \d数字 \D非数字 var str4 = '45abc78dddd' console.log(str4.match(/\d+/g)) // ["45", "78"] console.log(str4.match(/\D+/g)) // ["abc", "dddd"]

11-特殊字符-2

  // 1. ^ 匹配输入的开始,如果是多行模式,则可以匹配一行的开始

  // 2. $ 匹配输入的结束,如果是多行模式,则可以匹配一行的结束

  // 3. 当^作为第一个字符出现在一个字符集合模式时,它将会有不同的含义,如[^...]

  // 4. . 匹配除了换行以外的任何一个字符
  let str = 'abbc abc adfc afc'
  let str2 = 'abbc abc adfc vvv'
  console.log(str.match(/a.c/g)) // ["abc", "afc"]
  console.log(str.match(/a.+c/g)) // ["abbc abc adfc afc"]
  console.log(str2.match(/a.+c/g)) // ["abbc abc adfc"]

  // 5. (x)分组:匹配x并记住,()称为捕获括号
  // 5.1 不加括号只匹配一个字母,加括号可以匹配一组
  let str3 = 'fredd'
  console.log(str3.match(/d+/)) // ["dd", index: 3, input: "fredd", groups: undefined]
  let str4 = 'fredd fredd'
  console.log(str3.match(/(fred)+/)) // ["fred", "fred", index: 0, input: "fredd", groups: undefined]
  
  /** 5.2 使用括号里的模式对目标进行匹配,并且把结果存在\1...\n中,
    在接下来的模式表达式中可以使用\1...\n来代替前面匹配到的结果
  **/
  let str5 = 'foo bar foo bar'
  console.log(str5.match(/(foo) (bar) (foo) (bar)/)) // ["foo bar foo bar", "foo", "bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
  console.log(str5.match(/(foo) (bar) \1 \2/)) // ["foo bar foo bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
  console.log(str5.match(/(foo) (bar) (\1) (\2)/)) // ["foo bar foo bar", "foo", "bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]

  // foxxxfoo
  console.log(str5.match(/(.)o.*\1oo/)) //  ["foo bar foo", "f", index: 0, input: "foo bar foo bar", groups: undefined]

  console.log('abcabc'.match(/(.)b(.)/)) // ["abc", "a", "c", index: 0, input: "abcabc", groups: undefined]
  console.log('-----')
  console.log('abcabc'.match(/(.)b(.)(.)b(.)/)) // ["abcabc", "a", "c", "a", "c", index: 0, input: "abcabc", groups: undefined]
  console.log('abcabc'.match(/(.)b(.)\1b\2/)) // ["abcabc", "a", "c", index: 0, input: "abcabc", groups: undefined]
  
  console.log('abcfbc'.match(/(.)b(.)(.)b(.)/)) // ["abcfbc", "a", "c", "f", "c", index: 0, input: "abcfbc", groups: undefined]
  console.log('abcfbc'.match(/(.)b(.)\1b\2/)) // null

  // 5.3 replace 替换时使用分组信息不再是\ 而是 $n
  let str6 = 'hello worlde' // 目标: worlde hello
  // /w 表示 字母 数字 下划线 汉字
  console.log(str6.replace(/(\w+) (\w+)/, "$2 $1")) // worlde hello

  /** 5.4 分组捕获时如果再使用/g,则match操作不会捕获分组,
    如果必须使用/g 可以使用reg.exec(str)
  **/

  console.log(str6.match(/(l+)/g)) // ["ll", "l"]

  let reg = new RegExp("e", "g")
  console.log(reg.exec(str6)) // ["e", index: 1, input: "hello worlde", groups: undefined]
  console.log(reg.exec(str6)) // ["e", index: 11, input: "hello worlde", groups: undefined]
  console.log(reg.exec(str6)) // null

  let reg2 = new RegExp("(e)", "g")
  console.log(reg2.exec(str6)) // ["e", "e", index: 1, input: "hello worlde", groups: undefined]
  console.log(reg2.exec(str6)) // ["e", "e", index: 11, input: "hello worlde", groups: undefined]

  // 5.5 (?:x) 匹配但不记住,称为非捕获括号,因为分组只有9个
  let str1 = 'foo'
  console.log(str1.match(/(foo){1,2}/)) // ["foo", "foo", index: 0, input: "foo", groups: undefined]
  console.log(str1.match(/(?:foo){1,2}/)) // ["foo", index: 0, input: "foo", groups: undefined]

11-特殊字符-3

    // 1. x(?=y) 匹配x并且后面必须是y
    let str1 = 'foo fox'
    let str2 = 'fof fox'
    console.log(str1.match(/fo(?=o)/)) // ["fo", index: 0, input: "foo fox", groups: undefined]
    console.log(str2.match(/fo(?=x)/)) // ["fo", index: 4, input: "fof fox", groups: undefined]

    // 2. x(?!y) 匹配x并且后面必须不是y
    let str3 = 'fop fon'
    console.log(str3.match(/fo(?!p)/)) // ["fo", index: 4, input: "fop fon", groups: undefined]
    console.log(str3.match(/fo(?!n)/)) // ["fo", index: 0, input: "fop fon", groups: undefined]
    
    // 3. x|y 匹配x或者y
    console.log(str3.match(/fo(p|n)/)) // ["fop", "p", index: 0, input: "fop fon", groups: undefined]
    console.log(str3.match(/fo(p|n)/g)) // ["fop", "fon"]

    // 4. [] 或者
    // 4.1 [xyz] x或者y或者z
    let str4 = 'foao fax'
    console.log(str4.match(/f[oax]/g)) // ["fo", "fa"]

    // 4.2 范围:[0-9],[a-z],[a-zA-Z0-9]
    let str5 = 'a28bc'
    console.log(str5.match(/a[0-9]+b/g)) // ["a28b"]
    console.log(str5.match(/a[0-9]{1,2}[a-z]/g)) // ["a28b"]

    // 4.3 [12-89] 1或者2 到 8或者9
    let str6 = '029'
    console.log(str6.match(/[12-89]/)) // ["2", index: 1, input: "029", groups: undefined]

    // [^xyz] 中括号前^ 表示非,不是x不是y,不是z
    let str7 = 'abcde'
    console.log(str7.match(/a[^xy]c/)) // ["abc", index: 0, input: "abcde", groups: undefined]

12 .案例

  /** 1. 匹配电话 
    第一位:1  第二位: 34578 剩余九位数字
  **/
  let reg = /1[34578]\d{9}/
  console.log(reg.test('15789456123')) // true
  console.log(reg.test('1578945612c')) // false

  let str = '姓名:小尹 手机:15789456123 性别:女'
  console.log(str.replace(reg, '***')) // 姓名:小尹 手机:*** 性别:女

  // 2. 网页标签
  let str2 = 'sdsdsdf  dss'
  let reg2 = /<(.+)>.*<\/\1>/
  let reg3 = /<(.+)>(.*)<\/\1>/
  console.log(str2.match(reg2)) // ["", "div", index: 8, input: "sdsdsdf  dss", groups: undefined]
  console.log(str2.match(reg3)) // ["", "div", "[email protected]", index: 8, input: "sdsdsdf  dss", groups: undefined]

  // 3. 敏感词替换
  let str3 = '中国共产党中国人民解放军中国'
  console.log(str3.replace(/中国|军/g, '*')) // *共产党*人民解放**

  let result = str3.replace(/中国|军/g, input => {
    let t = ''
    for(let i = 0; i < input.length; i++) {
      t += '*'
    }
    return t
  })
  console.log(result) // **共产党**人民解放***

  // 4. 去首尾空格
  let str4 = ' 你好 怎么样 '
  console.log(str4.replace(/^\s+|\s+$/g, '')) // 你好 怎么样

  // 5. 千位分隔符
  let str5 = '1234567890123456'
  console.log(str5.replace(/(\d)(?=(?:\d{3})+$)/g, '$1,')) // 1,234,567,890,123,456

你可能感兴趣的:(JS正则笔记)