js正则表达式简单入门

正则表达式是一个用于操作字符串的很强大的工具,应用广泛,具有很高的价值。像我们很常见的表单校验功能,数据爬虫等都能用上。

分类

正则表达式中概念性的东西多而杂,不易于记忆和学习。为了易于学习,这几天我简单的给正则里的概念分类和整理了一下,这里记录一下。

方法

js中正则表达式对象的方法比较少,有3个

  • compile() 编译正则表达式
  • test() 检测字符串是否符合特定规则,返回true或者false
  • exec() 检索字符串中指定的值。返回找到的值,并确定其位置。

结构

结构涉及到的东西比较少,像双斜杠(//),表示定义正则表达式,你的正则表达式句子需要写在双斜杠中间;开头匹配符(^);结尾匹配符($)

  // 像 /ab/ 可以匹配到包含ab的字符串
  var str1 = 'hhhh你好啊ab再见222';
  var str2 = 'hhhhaaaab222';
  var str3 = 'hhhhhahhh2b';
  var reg = /ab/ ;
  console.log(reg.test(str1)); // 结果为true
  console.log(reg.test(str2)); // 结果为true
  console.log(reg.test(str3)); // 结果为false

上面的结果都很好理解,一眼就看出来了,那么加上开头匹配符和结尾匹配符呢?
例如像 /^abc$/ 匹配 'ab2efeafc' 和 'abc' 的结果。

    var reg = /^abc$/
    var str1 = 'ab2efeafc';
    var str2 = 'abc';
    console.log(reg.test(str1)); // false
    console.log(reg.test(str2)); // true

到这里也很好理解,但需要注意的是: 无论是^也好,还是$,还是之后的限定符,它们的作用范围都是临近的1个表达式或者字符的。

限定符

限定符,意思就是前面的规则重复几遍。在这里需要注意的是,限定符的只能作用于它前面的1个字符或者1个表达式。
例如: /ab{2}/ 这里到底是匹配 'abab' 还是 'abb' ?

    var reg = /ab{2}/;
    var str1 = 'abab';
    var str2 = 'abb';
    
    console.log(reg.test(str1)); // false
    console.log(reg.test(str2)); // true
    

限定符有以下几种形式

  • (?) 号,表示匹配前面的字符或表达式重复0次或者1次
  • (*) 号,表示匹配前面的字符或表达式重复0次或者多次
  • (+) 号,表示匹配前面的字符或表达式至少重复1次
  • ({n,m}),表示匹配前面的字符或表达式重复n-m次,若是n>m则会报错。
  • ({n}),表示匹配前面的字符或者表达式n次。
    var reg = /ab?c/;
    var str1 = 'abcab';
    var str2 = 'abbc';
    var str3 = 'accb'
    
    console.log(reg.test(str1)); // true
    console.log(reg.test(str2)); // false
    console.log(reg.test(str3)); // true

区域符

所谓区域符,是指仅仅想匹配某一些指定的字符串。这里区域符有2个,[]和()。
区域符很简单,比如想匹配 abc中的一个,用[abc],想匹配小写a-z中的一个,用[a-z],想匹配大写字母中的一个用[A-Z],相匹配数字可以这样写[0-9]
又比如匹配 . * ? + \等特殊字符,可以用[\.\*\?\+\\]这样。

元字符

元字符,即拥有特殊含义的字符。比如匹配数字,可以用\d,匹配非数字用\D;匹配换行符用\n等。具体如下

  • (.) 号,匹配单个字符,除了换行和行结束符。
  • \d ,匹配数字。
  • \D ,匹配非数字。
  • \w ,匹配单词。
  • \W ,匹配非单词。
  • \s ,匹配空白符。
  • \n ,匹配换行符。
  • \f ,匹配换页符。
  • \r ,匹配回车符。
  • \t ,匹配制表符。
  • \v ,匹配垂直符。

比如js中,去除字符串中的所有空格可以这样写,var newStr = oldStr.replace(/\s/g,"");
想匹配数字可以用\d ,和[0-9]是等效的。

    // 例如简单匹配手机号可以这样写,12号段目前是没有的
    var reg = /^1[3456789]\d{9}$/;
    var phone1 = '12890908931'
    var phone2 = '13078765638'
    var phone3 = '130909028931'  // 12个字符
    var phone4 = '1879089789'  // 10个字符
    var phone5 = '14909038x9' // 中间有非数字
    
    console.log(reg.test(phone1)); // false
    console.log(reg.test(phone2)); // true
    console.log(reg.test(phone3)); // false
    console.log(reg.test(phone4)); // false
    console.log(reg.test(phone5)); // false
    

转义字符

在正则中,有些字符有特殊作用,像? + . / \ 等,如果想匹配这些字符呢?那就用反斜杠()转义一下。
例如: \+ \. \\ \/等。

总结

学会上面那些,就算是正则入门啦,以后简单的规则校验也难不倒了,就算是稍微复杂点的正则也能看懂了。

你可能感兴趣的:(js正则表达式简单入门)