正则表达式(初学)

正则表达式:是一个描述字符集的对象。

一、正则表示式语法

1、直接量字符

字符 匹配
字母和数字字符 自身
\o NUL字符
\t 制表符
\n 换行符
\v 垂直制表符
\f 换页符
\r 回车符

在正则表达式中,某些标点符号具有特殊含义:
^ $ . * + ? = | \ / () [] {}
如果想要在正则表达式中使用,则必须加"\"进行转义。
2、字符类
将直接量字符放进方括号就组成了字符类,一个字符类可以匹配他所包含的任意字符。

字符 匹配
字母和数字字符 自身
[...] 方括号内的任意字符
[ ^...] 不在方括号内的任意字符
. 除了回车符和换行符之外的所有字符
\w 单词字符(字母、数字、下划线)
\W 非单词字符
\s 空白符
\S 非空白符
\d 数字符
\D 非数字
[\b] 退格直接量(特例)

3、边界

字符 匹配
^ 以xx开头
$ 以xx结尾
\b 单词边界,指[a-zA-Z_0-9]之外的字符
\B 非单词边界

4、重复

之前介绍的匹配都是一一匹配,两位数匹配\d\d,四位数\d\d\d\d。
表示这种情况的字符定义--重复字符语法:

字符 匹配
{n,m} 匹配前一项n-m次
{n,} 匹配前一项n以上次数
{n} 匹配前一项n次
? 匹配前一项最多一次{0,1}
+ 匹配前一项最少1次{1,}
* 匹配前一项0或多次{0,}

例子:

/\d{2,4}/           //匹配2-4个数字
/\w{3}\d?/          //匹配3个单词字符和一个可选数字
/\s+java\s+/        //匹配前后带有一个或者多个空格的字符串“java”
/[^(]*/             //匹配一个或多个非"("的字符
  • 贪婪匹配
    对于{n,m},当出现多于m次符合条件的字符,将尽可能多的匹配,而且允许后续的正则表达式继续匹配。
    '123456789'.match(/\d{3,5}/g); //["12345", "6789"]
  • 非贪婪匹配
    让正则表达式尽可能少的匹配。只需在待匹配的字符后面跟随:"??"、"+?"、"*?"。
    '123456789'.match(/\d{3,5}?/g); //["123", "456", "789"]
    5、选择、分组、引用
"|"

用于分隔供选择的字符。
注意:选择项的匹配次序是从左至右,直到发现匹配项,就忽略右边的。
'ab'.match(/a|ab/) //["a"]

"()"

① 可以组合"|"、"*"、"+"处理单元项:/java(script)?/、/(ab|cd)+|ef/
② 在完整的模式中定义子模式。当一个字符串和模式相匹配时,可以从子模式"()"中找到字符串中这部分匹配:/[a-z]+\d/、/[a-z]+(\d)/我们就可以从匹配的字符串中抽出数字。
③ 允许在同一正则表达式的后部引用前面的子表达式,这是通过在""加数字来实现:\1 引用的是第一个带圆括号的子表达式,\3 引用的是第三个带圆括号的子表达式。

字符 含义
竖线 选择,匹配该符号左边的子表达式或右边的
(...) 组合,而且可以记住与这个组合匹配的字符以供此后的引用
(?:...) 只组合,但不记忆与该组匹配的字符
\n 和第n个分组第一次匹配的字符相匹配,组索引是从左到右的'('数,'(?:'不计入索引

6、正则表达式标识符

字符 含义
i 执行字符串匹配时不区分大小写
g 找到字符串中所有匹配,而不是找到一个就停止
m 多行匹配模式,^匹配一行的开头和字符串的开头,$匹配行的结束和字符串的结束

一个正则表达式就是一个模式与上面三个标志的结合。

二、模式匹配的方法

  • String方法
    1、search() 参数是一个正则表达式(如果不是,首先会通过RegExp构造函数将他转换成正则表达式),返回第一个与之匹配的字符串的起始位置,如果找不到,返回-1。
    PS:search方法不支持全局检索,他会忽略正则表达式中的修饰符g。
    2、replace() 用以执行检索与替换,第一个参数是一个正则表达式,第二个是要替换的字符串。如果第一个参数是一个字符串,则replace将直接搜索这个字符串进行替换。
    3、match() 唯一参数是一个正则表达式(或是通过RegExp构造函数将其转换为正则表达式),返回的是一个由匹配结果组成的数组。
    如果是全局检索,则返回匹配的所有字符串数组。
    如果不是全局检索,则返回第一个匹配字符串数组:数组第一个元素是匹配的字符串,余下的元素是是正则表达式中使用圆括号括起来的子表达式。
var test='Visit my blog at http://www.example.com/~david';
var url=/(\w+):\/\/([\w.]+)\/(\S*)/;
test.match(url);
//["http://www.example.com/~david", "http", "www.example.com", "~david"]
  • RegExp实例方法
    1、exec() 接受一个参数,要匹配的字符串,属性:index和input。
    ① 设置全局属性,每次只返回一个匹配项,第一次调用返回第一个匹配,第二次调用返回第二个匹配,lastIndex属性会增加。
    ② 不在全局下,在统一字符串上多次调用exec()将始终返回第一个匹配项,lastIndex始终保持不变。
var text="cat,bat,sat,fat";
var pattern1=/.at/;

var matchs=pattern1.exec(text);
alert(matchs.index);            //0
alert(matchs[0]);               //cat
alert(matchs.lastIndex);        //0

matchs=pattern1.exec(text);
alert(matchs.index);            //0
alert(matchs[0]);               //cat
alert(matchs.lastIndex);        //0

var pattern2=/.at/g;

var matchs=pattern2.exec(text);
alert(matchs.index);             //0
alert(matchs[0]);                //cat
alert(matchs.lastIndex);         //3

matchs=pattern2.exec(text);
alert(matchs.index);              //5
alert(matchs[0]);                 //bat
alert(matchs.lastIndex);          //8

听人家说要想把正则表达式学得好,推荐看《精通正则表达式》,今天就学到这里。
常用的验证
1、邮箱验证
/^\w+[\.\w]*@\w+[\.\w]+[^\.]$/
2、电话验证
写一个正则,验证电话号码:格式为:"区号-号码",其中区号是010、或者02N、0NNN,号码是7-8位数字。
/^0(10|2\d|\d{3})-\d{7,8}$/

你可能感兴趣的:(正则表达式(初学))