正则表达式:概述、在 JavaScript 中的使用、以及正则表达式中的特殊字符和替换

1、正则表达式概述

1.1 什么是正则表达式

正则表达式( Regular Expression )是用于匹配字符串中字符组合的模式。在 JavaScript中,正则表达式也是对象。

正则表通常被用来检索、替换那些符合某个模式(规则)的文本,例如验证表单:用户名表单只能输入英文字母、数字或者下划线, 昵称输入框中可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等 。

其他语言也会使用正则表达式,本阶段我们主要是利用 JavaScript 正则表达式完成表单验证。

1.2 正则表达式的特点

  1. 灵活性、逻辑性和功能性非常的强。
  2. 可以迅速地用极简单的方式达到字符串的复杂控制。
  3. 对于刚接触的人来说,比较晦涩难懂。比如: ^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
  4. 实际开发,一般都是直接复制写好的正则表达式。但是要求会使用正则表达式并且根据实际情况修改正则表达式, 比如用户名:/^[a-z0-9_-]{3,16}$/

2、正则表达式在 JavaScript 中的使用

2.1 创建正则表达式

在 JavaScript 中,可以通过两种方式创建一个正则表达式。

(1) 通过调用 RegExp 对象的构造函数创建

var 变量名 = new RegExp(/表达式/);

(2)通过字面量创建

var 变量名 = /表达式/;

// 注释中间放表达式就是正则字面量。

2.2 测试正则表达式 test

test() 正则对象方法,用于检测字符串是否符合该规则,该对象会返回 true 或 false,其参数是测试字符串。

regexObj.test(str);
  1. regexObj 是写的正则表达式
  2. str 我们要测试的文本
  3. 就是检测 str 文本是否符合我们写的正则表达式规范。

3、 正则表达式中的特殊字符

3.1 正则表达式的组成

一个正则表达式可以由简单的字符构成,比如 /abc/,也可以是简单和特殊字符的组合,比如 /ab*c/ 。其中特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符号,如 ^ 、$ 、+ 等。

特殊字符非常多,可以参考:

  • MDN:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions
  • jQuery 手册:正则表达式部分
  • 正则测试工具: http://tool.oschina.net/regex

3.2 边界符

正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符。

边界符 说明
^ 表示匹配行首的文本(以谁开头)
$ 表示匹配行尾的文本(以谁结束)

如果 ^ 和 $ 在一起,表示必须是精确匹配。

代码:

    <script>
        // 边界符 ^ $ 
        // 正则表达式里面不需要加引号 不管是数字型还是字符串型 也不要随便加空格
        var regexp = /abc/;  // /abc/ 只要包含有abc这个字符串返回的都是true
        console.log(regexp.test('abc'));    // true
        console.log(regexp.test('abcd'));   // true
        console.log(regexp.test('aabc'));   // true
        console.log(regexp.test('acb'));    // false
        console.log('---------------------------');
        var regexp1 = /^abc/;  // /^abc/ 以abc这个字符串开头的返回的都是true
        console.log(regexp1.test('abc'));    // true
        console.log(regexp1.test('abcd'));   // true
        console.log(regexp1.test('aabc'));   // false
        console.log('---------------------------');
        var reg1 = /^abc$/;   // 精确匹配 要求必须是 abc字符串才符合规范
        console.log(reg1.test('abc'));   // true
        console.log(reg1.test('abcd'));  // false
        console.log(reg1.test('aabcd')); // false
        console.log(reg1.test('abcabc')); // false
    </script>

3.3 字符类

字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。

1. [] 方括号

/[abc]/.test('andy') // true

后面的字符串只要包含 abc 中任意一个字符,都返回 true 。

2. [-] 方括号内部 范围符-

/^[a-z]$/.test(c') // true

方括号内部加上 - 表示范围,这里表示 a 到 z 26个英文字母都可以。

3. [^] 方括号内部 取反符^

/[^abc]/.test('andy') // false

方括号内部加上 ^ 表示取反,只要包含方括号内的字符,都返回 false 。

注意和边界符 ^ 区别,边界符写到方括号外面。

4. 字符组合

/[a-z1-9]/.test('andy') // true

方括号内部可以使用字符组合,这里表示包含 a 到 z 的26个英文字母和 1 到 9 的数字都可以。

代码:

    <script>
        //var rg = /abc/;  只要包含abc就可以 
        // 字符类: [] 表示有一系列字符可供选择,只要匹配其中一个就可以了
        var rg = /[abc]/; // 只要包含有a 或者 包含有b 或者包含有c 都返回为true
        console.log(rg.test('andy'));   // true
        console.log(rg.test('baby'));   // true
        console.log(rg.test('color'));  // true
        console.log(rg.test('abc'));    // true
        console.log(rg.test('red'));    // false
        console.log('------------------');

        var rg1 = /^[abc]$/; // 三选一 只有是a 或者是 b  或者是c 这三个字母才返回 true
        console.log(rg1.test('aa'));    // false
        console.log(rg1.test('a'));     // true
        console.log(rg1.test('b'));     // true
        console.log(rg1.test('c'));     // true
        console.log(rg1.test('abc'));   // false
        console.log('------------------');

        var reg = /^[a-z]$/; // 26个英文字母任何一个字母返回 true  - 表示的是a 到z 的范围  
        console.log(reg.test('a'));     // true
        console.log(reg.test('z'));     // true
        console.log(reg.test(1));       // false
        console.log(reg.test('A'));     // false
        console.log('------------------');

        // 字符组合
        var reg1 = /^[a-zA-Z0-9_-]$/; // 26个英文字母(大写和小写都可以)任何一个字母返回 true  
        console.log(reg1.test('a'));    // true
        console.log(reg1.test('B'));    // true
        console.log(reg1.test(8));      // true
        console.log(reg1.test('-'));    // true
        console.log(reg1.test('_'));    // true
        console.log(reg1.test('!'));    // false
        console.log('----------------');

        // 如果中括号里面有^ 表示取反的意思 千万和 我们边界符 ^ 别混淆
        var reg2 = /^[^a-zA-Z0-9_-]$/;
        console.log(reg2.test('a'));   // false
        console.log(reg2.test('B'));   // false
        console.log(reg2.test(8));     // false
        console.log(reg2.test('-'));   // false
        console.log(reg2.test('_'));   // false
        console.log(reg2.test('!'));   // true
    </script>

3.4 量词符

量词符用来设定某个模式出现的次数

量词 说明
* 重复0次或更多次
+ 重复1次或更多次
重复0次或1次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

代码:

    <script>
        // 量词符: 用来设定某个模式出现的次数
        var reg = /^a$/;
        console.log(reg.test('a'));   // true
        console.log(reg.test('aa'));  // false
        console.log('--------------------------------------');

        // 1. * 相当于 >= 0 可以出现0次或者很多次 
        var reg1 = /^a*$/;
        console.log(reg1.test(''));// true
        console.log(reg1.test('a'));// true
        console.log(reg1.test('aa'));// true
        console.log(reg1.test('aaaaaa'));// true
        console.log('--------------------------------------');

        // 2. + 相当于 >= 1 可以出现1次或者很多次
        var reg2 = /^a+$/;
        console.log(reg2.test(''));// false
        console.log(reg2.test('a'));// true
        console.log(reg2.test('aa'));// true
        console.log(reg2.test('aaaaaa'));// true
        console.log('--------------------------------------');

        // 3. ?  相当于 1 || 0
        var reg3 = /^a?$/;
        console.log(reg3.test(''));// true
        console.log(reg3.test('a'));// true
        console.log(reg3.test('aa'));// false
        console.log(reg3.test('aaaaaa'));// false
        console.log('--------------------------------------');

        // 4. {3 } 就是重复3次
        var reg4 = /^a{3}$/;
        console.log(reg4.test(''));// false
        console.log(reg4.test('a'));// false
        console.log(reg4.test('aa'));// false
        console.log(reg4.test('aaaaaa'));// false
        console.log(reg4.test('aaa'));// true
        console.log('--------------------------------------');

        // 5. {3, }  大于等于3
        var reg5 = /^a{3,}$/;
        console.log(reg5.test(''));// false
        console.log(reg5.test('a'));// false
        console.log(reg5.test('aa'));// false
        console.log(reg5.test('aaaaaa'));// true
        console.log(reg5.test('aaa'));// true
        console.log('--------------------------------------');

        // 6. {3, 16}  大于等于3 并且 小于等于16
        var reg6 = /^a{3,16}$/;
        console.log(reg6.test(''));// false
        console.log(reg6.test('a'));// false
        console.log(reg6.test('aa'));// false
        console.log(reg6.test('aaaaaa'));// true
        console.log(reg6.test('aaa'));// true
        console.log(reg6.test('aaaaaaaaaaaaaaaaaaaaa'));// false
    </script>

4.5 括号总结

  1. 大括号 量词符。里面表示重复次数。
  2. 中括号 字符集合。匹配方括号中的任意字符。
  3. 小括号 表示优先级。

可以在线测试:正则表达式在线测试小工具

3.6 预定义类

预定义类指的是某些常见模式的简写方式

预定类 说明
\d 匹配0-9之间的任意数字,相当于[0-9]
\D 匹配所有0-9以外的字符,相当于[^0-9]
\w 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_]
\W 除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_]
\s 匹配空格(包括换行符、制表符、空格符等),相当于[\t\r\n\v\f]
\S 匹配非空格的字符,相当于[^\t\r\n\v\f]

4、正则表达式中的替换

4.1 replace 替换

replace() 方法可以实现替换字符串操作,用来替换的参数可以是一个字符串或是一个正则表达式。

stringObject.replace(regexp/substr,replacement);
  1. 第一个参数:被替换的字符串 或者 正则表达式
  2. 第二个参数:替换为的字符串
  3. 返回值是一个替换完毕的新字符串

4.2 正则表达式参数

/表达式/[switch]

switch(也称为修饰符) 按照什么样的模式来匹配 。有三种值:

  • g:全局匹配
  • i:忽略大小写
  • gi:全局匹配 + 忽略大小写

4.3 案例:敏感词过滤

DOCTYPE html>
<html lang="en">

<head>
    <meta charset="UTF-8">
    <title>敏感词过滤title>
head>

<body>
    <textarea name="" id="message" cols="30" rows="10">textarea>
    <button>提交button>
    <div>div>
    <script>
        // 替换 replace
        // var str = 'andy和red';
        // var newStr = str.replace('andy', 'baby');
        // console.log(newStr);
        
        var text = document.querySelector('textarea');
        var btn = document.querySelector('button');
        var div = document.querySelector('div');
        btn.onclick = function () {
            div.innerHTML = text.value.replace(/激情|gay/g, '**');
        };
    script>
body>

html>

你可能感兴趣的:(javascript,正则表达式,javascript)