js正则学习笔记

工作中不可避免的会用到正则表达式,现就正则做以下总结。

  • 正则简介
    正则表达式是一种表达文本模式(即字符串结构)的方法,常常用作按照“给定模式”匹配文本的工具。
    有两种创建方式,一种是使用字面量,以斜杠表示开始和结束。另一种是使用 RegExp 构造函数。
  • 正则匹配规则
    • 字面量字符
      字符只表示字面的含义,无其他特殊含义。例如/abc/就匹配字符串abc
    • 元字符
      字符有特殊含义,不代表字面的意思。主要有以下几种:
      ^表示字符串的开始位置。
      $ 表示字符串的结束位置。
      | 表示或关系。
      .表示除回车、换行 、行分隔符和段分隔符以外的所有字符。
      除此之外,还有\,*,+,?,(),[],{}等。
      此类字符如果要匹配它们本身,就需要在它们前面要加上反斜杠。
    • 字符类
      字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。
      如果方括号内的第一个字符是^,则表示除了字符类之中的字符,其他字符都可以匹配。
      对于连续序列的字符,连字符-用来提供简写形式,表示字符的连续范围。
      注意,字符类的连字符必须在头尾两个字符中间,才有特殊含义,否则就是字面含义。
      例如:/[0-9]/匹配0到9的数字;/[^0-9]/匹配除了0到9之外的所有字符。

注意:大部分元字符在字符类中表示它们本身的含义,不代表特殊含义。

  • 预定义模式
    为了我们的方便,js将一些常用的字符类进行了包装,并提供了简写方式给我们,这就是预定义模式。
    \d:匹配0-9之间的任一数字,相当于[0-9]。
    \D:匹配所有0-9以外的字符,相当于[^0-9]。
    \w:匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_]。
    \W:除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_]。
    \s:匹配空格(包括制表符、空格符、断行符等),相等于[\t\r\n\v\f]。
    \S:匹配非空格的字符,相当于[^\t\r\n\v\f]。
    \b:匹配词的边界。
    \B:匹配非词边界,即在词的内部。

  • 重复类
    模式的精确匹配次数,使用大括号({})表示。{n}表示恰好重复n次,{n,}表示至少重复n次,{n,m}表示重复不少于n次,不多于m次。

  • 量词符
    ?问号表示某个模式出现0次或1次,等同于{0, 1}。
    * 星号表示某个模式出现0次或多次,等同于{0,}。
    +加号表示某个模式出现1次或多次,等同于{1,}。

  • 贪婪模式
    三个量词符,默认情况下都是最大可能匹配,即匹配直到下一个字符不满足匹配规则为止。
    如果想将贪婪模式改为非贪婪模式,可以在量词符后面加一个问号。

  • 修饰符
    修饰符表示模式的附加规则,放在正则模式的最尾部,可以单个使用,也可以多个一起使用。
    i:表示忽略大小写;g:表示全局匹配;m:表示多行模式。

  • 组匹配
    我们知道重复类只能给单个字符设置,那么假如我们要重复hello三遍该怎么写呢?此时就要用到组匹配。
    例如:var reg = /(hello){3}/。圆括号表示分组匹配。在正则表达式内部,可以用\n引用括号匹配的内容,n是从1开始的自然数,表示对应顺序的括号。
    (?:x)称为非捕获组,表示不返回该组匹配的内容,即匹配的结果中不计入这个括号。
    x(?=y)称为先行断言,表示x只有在y前面才匹配,y不会被计入返回结果。
    x(?!y)称为先行否定断言,表示x只有不在y前面才匹配,y不会被计入返回结果。

  • 正则对象属性与方法

    • 属性:
      ignoreCase:返回一个布尔值,表示是否设置了i修饰符,该属性只读。
      global:返回一个布尔值,表示是否设置了g修饰符,该属性只读。
      multiline:返回一个布尔值,表示是否设置了m修饰符,该属性只读。
      lastIndex:返回下一次开始搜索的位置。该属性可读写,但是只在设置了g修饰符时有意义。
      source:返回正则表达式的字符串形式(不包括反斜杠),该属性只读。
    • 方法:
      test():返回一个布尔值,表示当前模式是否能匹配参数字符串。
      exec():返回一个数组,成员是每一个匹配成功的子字符串,否则返回null。
      如果正则表示式包含圆括号(即含有“组匹配”),则返回的数组会包括多个成员。第一个成员是整个匹配成功的结果,后面的成员就是圆括号对应的匹配成功的组。该数组还包含以下两个属性,input表示整个原字串,index表示整个模式匹配成功的开始位置(从0开始计数)。
  • 工作中常用的正则

    • 邮箱验证:var reg = /^([\w+])+@\w+([.]\w+)+$/
    • 手机号验证:var reg = /^1((3[0-9])|(8[0-9])|(5[^4])|(4[5789])|(7[35678]))\d{8}$/
    • 中文验证:var reg = /[\u4e00-\u9fa5]*/

你可能感兴趣的:(js正则学习笔记)