正则表达式 笔记

最近这段时间,在网上看了下正则的文章,但是看过之后很容就忘记了,特此记录下

工具:https://regexper.com

常用元字符

正则表达式 笔记_第1张图片

大写就是取反 \B就是\b的取反

常用限定符

正则表达式 笔记_第2张图片

取消贪婪匹配 在元字符后面接? 例如:*?、+?、{n,}?

正则表达式 笔记_第3张图片

使用非贪婪模式

正则表达式 笔记_第4张图片
Paste_Image.png

例1 手机号正则

/^1[34578][0-9]{9}$/

正则表达式 笔记_第5张图片

以数字1开头,然后接(3,4,5,7,8)中的一个数字,然后接0-9的数字(出现9次),并且以数字结尾。上图中的8 times的意思是:已经匹配的内容,再来8次,加上已经有的一次,一共9次

例2 单词边界

/\bis\b/

is前后都是单词的边界 \b指[a-zA-Z_0-9] 之外的字符

正则表达式 笔记_第6张图片

例3 URL分组替换

/http:(\/\/.+\.jpg)/

正则表达式中的括号()用来分组,这个时候可以用$1 来获取group #1中的内容

这个功能的意义,如果网站用了https,网站引用静态资源也必须是https,否则报错,如果写成//则会自动识别http 或者 https

例4 日期匹配与分组替换

/^\d{4}[/-]\d{2}[/-]\d{2}$/

以数字开头,然后匹配四个数字,然后是 one of(表示其中任何一个都行),后面的规则基本就是重复了,然后结尾的时候要是数字

正则表达式 笔记_第7张图片

可以结合一下分组的特性,做一个时间格式化
/^(\d{4})[/-](\d{2})[/-](\d{2})$/

正则表达式 笔记_第8张图片
Paste_Image.png

修饰符

  • g : global 执行一个全局匹配
  • i : ignore case 执行一个不区分大小写的匹配
  • m : 多行匹配

修饰符可以一起使用 var reg = /aa/gim

字符取反 ^

表示不属于此类

范围类[-]

正则表达式支持一定范围规则 [a-z] [A-Z] [0-9] 可以连写[a-zA-Z0-9]

贪婪与懒惰(非贪婪)

正则表达式默认会匹配贪婪模式
/\d{3,6}/

贪婪模式下,匹配了最多的情况

懒惰模式 /\d{3,6}?/

分行匹配模式

(?m) -》记号,分行匹配模式使得正则表达式引擎把行分隔符当做一个字符串分隔符来对待。在分行匹配模式下,^不仅匹配正常的字符串开头,还将匹配行分隔符(换行符)后面的开始位置

在使用时,(?m)必须出现在整个模式的最前面,就像下面这个例子一样:我们将用一个正则表达式,把js里面的注释内容全部找出来

正则表达式 笔记_第9张图片

^\s//.$ 将匹配一个字符串的开始,然后是任意多个空白字符,再后面的是//(js里面的注释),后面再接匹配任意文本,因为*是一个‘贪婪型’元字符。加上(?m)前缀后,上面的正则将把换行符视为一个字符串分隔符,这样就可以把每一行注释都匹配出来了

|或操作符的注意事项

如果我们需要匹配一个年份,例如:2015-08-26,正则表达式可能是 /19|20\d{2}/。这个正则只能匹配到20,不会匹配到2015,这是因为|操作符是把位于它左边和右边的两个部分都作为一个整体来看待的,它会把模式/19|20\d{2}/解释为1920\d{2},正确的写法应该是/(19|20)\d{2}/

回溯引用

例子:假如我们有一段文本,我们要找到这段文本中连续重复出现的单词(同一个单词输入了2遍)。显然,在搜索某个单词的第二次出现时,这个单词必须是已知的。回溯引用允许正则表达式模式引用前面的匹配结果

正则表达式 笔记_第10张图片

解释一下:[ ]+匹配一个或多个空格,(\w+)匹配一个或多个字母数字字符,这里的()是把整个模式的一部分单独划分出来以便在后面引用,就是\1;这个\1就是回溯引用,而它引用的是前面划分出来的那个子表达式(\w+)。当(\w+)匹配到of的时候,\1也匹配到单词of
\1代表着模式里的第一个子表达式,\2代表着第二个子表达式,依次类推
\0可以用来代表整个表达式

例子二:匹配html标题

正则表达式 笔记_第11张图片

解释:([1-6])匹配h标签后面的数字,然后是.*?懒匹配,后面的\1匹配第一个子表达式([1-6])。使用回溯之后,上面那个错误的标签就没有被匹配到

前后查找

正则表达式 笔记_第12张图片

这是一个向前查找的例子: (?=),=号后面接要要查找的的内容,但是结果里面不包含进去,

例子三:

var str = '1234 5678';
var reg = /(\d{4}) (\d{4})/;
var res = str.replace(reg,'$2 $1');
console.log(res);// 5678 1234

重复字符查找

例如需要查找某个字符串中的连续字符 '12355578999'

str.match(/(\d)\1{2}/g)  // [999]
// 这里的\1 匹配的是前面\d所匹配的字符串,然后重复2次,这里找到的就是连续3次重复的字符

参考资料

http://gold.xitu.io/post/582dfcfda22b9d006b726d11
http://deerchao.net/tutorials/regex/regex.htm
正则表达式必知必会

你可能感兴趣的:(正则表达式 笔记)