正则表达式 - Regular Expression

认识正则表达式 - Regular Expression

目的:验证字符串是否符合规则
是一个复杂数据类型


正则表达式的创建
  • 正则表达式的创建
    1、字面量方式创建
    语法:var reg = /内容/
    2、内置构造函数创建
    语法:var reg = new RegExp(’ 内容 ')

正则表达式的常用方法
  • 正则表达式的常用方法
    1、匹配
    目的:检测对错
    语法:正则表达式.test(字符串)
    返回值:一个布尔值
    如果字符串满足正则表达式规则,那么返回true 否则返回 false
    2、捕获
    目的:从原始字符串中截取符合正则表达式规则的部分字符串片段

正则表达式的组成

文本内容
元字符:在正则表达式内用一个符号来表示一类内容
标识符

  • 基本元字符
    1、\d 表示 一位 数字
    2、\D 表示 一位 非数字
    3、\s 表示 一位 空白内容(空格,缩进)
    4、\S 表示 一位 非空白内容
    5、\w 表示 一位 数字字母下划线任意内容
    6、\W 表示 一位 非数字字母下划线的任意内容
    7、. 表示 一位 非换行的任意内容
    8、\ 表示 转义符

字符串
  • 字符串
  • 在字符串内, \ 也是表示转义符
  • 在字符串内书写 \s 这个内容, 相当于把没有意义的 s 文本转换成有意义的符号
    => 但是字符串内没有 \s 这个符号规则
    => 字符串就会默认把它解析为 s 文本
  • 在你使用内置构造函数方式创建正则表达式的时候
    => 第一个参数是以字符串的形式书写正则内容
    => 当你在字符串内书写 ‘\s’ 的时候, 因为字符串规则, 会把他解析为 ‘s’
    => 给到正则的内容就是 ‘s’
    => 组装出来的就是 /s/
  • 在你使用内置构造函数方式创建正则表达式的时候
    => 第一个参数是以字符串的形式书写正则内容
    => 当你在字符串内书写 ‘\s’ 的时候, 因为字符串规则, 第一个 \ 是把 第二个 \ 转义了
    => 就会在字符串内留下一个 斜线 和 s 文本
    => 当你把这个内容当做第一个参数写入的时候
    => 出来的正则就是 /\s/

边界元字符
  • 边界元字符
    1、^ 表示字符串开始(开头)
    2、$ 表示字符串结束(结尾)
    注意:当 ^ 和 $ 一起使用的时候,表示 从开始 到结束
    没有 ^ 和 $ 叫做 包含
    有 ^ 和 $ 叫做 只能

限定元字符
  • 限定元字符
    概念:一个限定符只能修饰前面一个符号
    1、* 表示重复出现 0~正无穷次
    2、+ 表示重复出现1~正无穷次
    3、? 表示重复出现0~1次
    4、{n} 表示重复出现n次
    5、{n, } 表示重复出现n~正无穷次
    6、{n, m} 表示重复出现n~m次

特殊元字符
  • 特殊元字符
    1、()
    含义1:一个整体
    含义2:单独捕获 (在下面单独写)
    2、|
    或者
    一般和 () 连用
    只有 () 和 ^ 和 $ 能区分或的边界
    3、[ ]
    注意:一个 [ ] 只占一个字符位置
    书写在 [ ] 内的任意一个字符都行
    4、[ ^ ]
    注意:一个 [ ] 只占一位字符位置
    书写在 [ ^ ] 内的任意一个字符都不行
    5、中划线(-)
    表示 至 或者 到
    一般和 [ ] 连用
    注意:必须保证ASCII 码是连续的、
    特殊: \u4e00-\u9fa5 所有中文

重复元字符
  • 重复元字符
    1、\1 \2 \3 \4 \5 \6 \7 \8 \9
    重复出现
    需要第n个() 出现的内容一摸一样
    注意:不是重复几次,是重复第几个小括号

预查元字符
  • 预查元字符
    1、正向肯定预查
    (?=内容)真实正则内容
    2、正向否定预查
    (?!内容)真实正则内容
    3、负向肯定预查
    (?<=内容)真实正则内容
    4、负向否定预查
    (?!=内容)真实正则内容

标识符
  • 标识符
    书写在正则外面,正则的后面
    用来修饰整个正则表达式使用的
    1、g 全局标识符 global
    2、i 忽略大小写 ignore

捕获
  • 捕获
    语法:正则.exec (字符串)
    返回值:
    1、原始字符串内没有符合正则要求的字符串片段
    返回值就是 null
    2、原始字符串内有符合正则要求的字符串片段
    返回值是一个数组类型数据,[0]位置就是从字符串内捕获出来的内容
    2.1、正则没有() 没有全局标识符 g
    返回值数组只有[0]数据
    不管捕获多少次,正则都是从原始字符串开始位置进行检索
    2.2、正则有()
    返回值数组[0]依旧是捕获出来的完整字符串片段
    从[1]开始依次是每一个小括号的单独内容捕获
    2.3、正则有g
    返回的数组[0]依旧是捕获出来的完整字符串片段
    但是从第二次开始,会从第一次捕获结束位置开始检索
    以此类推,直到找不到了为止,返回null
    在下一次又从字符串开始位置进行检索
    -匹配但不捕获
    ( ?: )

正则的两大特性

1、懒惰性
当捕获内容的时候,每一都会默认从字符串的开头开始检索
解决方案:加一个全局标识符 g
2、贪婪性
贪婪匹配 尽可能多的捕获
非贪婪匹配 尽可能少的捕获
解决方案:使用非贪婪限定符

贪婪匹配  指的都是 限定符
    + 贪婪限定符
      => *
      => +
      => ?
      => {n,}
      => {n,m}
    + 非贪婪限定符
      => *?
      => +?
      => ??
      => {n,}?
      => {n,m}?

创建方式的区别

1、书写标识符的区别
字面量:直接书写在正则的后面

const reg = /adcd/gi

内置构造函数:以第二个参数的形式书写

const reg = new RegExp('abcd','gi')

2、拼接变量的能力
字面量方式不能进行变量拼接
内置构造函数可以拼接,因为内置构造函数的第一个参数是一个字符串型数据
3、书写基本元字符
字符量:/\s\d\w/
内置构造函数:new Regexp(’\s\d\w’)


字符串常用方法
  • 字符串常用方法
    1、replace()
    语法:
    字符串.replace(换下字符,换上字符)
    字符串.replace(正则表达式,换上字符)
    返回值:替换好的字符串
    当传递的是正则表达式,并且带有 g 标识符的时候,会全部替换
    2、search()
    语法:
    字符串.search(字符串片段)
    字符串.search(正则表达式)
    返回值:
    如果有该字符串片段,就是该字符串片段的开始索引位置
    如果没有该字符串片段,就是 -1
    3、match()
    语法:
    字符串.match(字符串片段)
    字符串.match(正则表达式)
    返回值:
    当参数传递字符串片段,或者没有 g 的正则表达式的时候,和exec 一摸一样
    当参数传递正则表达式,并且有全局标识符 g 的时候,返回值是一个数组,里面是捕获到的所有内容

你可能感兴趣的:(正则表达式,正则表达式)