**正则**
- 计算机科学的一个概念,用于检索匹配或替换符合规则的文本
- 语法
- var expression = / pattern / flags
- pattern表示一个简单的或复杂的正则表达式
- flags表示匹配模式,支持3个标志
- g代表全局,而非发现第一个立即返回
- i代表不区分大小写进行匹配
- m代表多行匹配
- 创建一个正则的方法
- var reg = /正则的语法/; 这种属于字面量的创建方式
- 例:var reg = /Abc/gi;
- var reg = new RegExp(正则表达式的语法, flags); 这种属于实例创建
- 例:var reg = new RegExp('Abc', 'gi')
- 上面的意思代表匹配Abc的文本,全局查找,不区分大小写
- 正则的方法
- test()
- 接受一个要检测的文本返回布尔值
- 例如: var reg = /abc/g; var str = 'acbabcnnmmabc'; reg.test(str) // 匹配到返回true
- exec
- 接受一个要匹配的字符串,返回一个数组,包含index下标,为第一个字符出现的位置,input,为原字符串,以及要匹配的字符串(始终在数组中的第一位),只返回第一个匹配到的,匹配不到返回null
- 例如: var reg = /abc/g; var str = 'acbvabcmmabcabc'; reg.exec(str) //返回 ["abc", index: 4, input: "abscabcabcAbc", groups: undefined]
- 当出现捕获组则按组匹配返回,数组中第一个始终是要匹配的元素,其他的为匹配到的组
- 例如 var reg = /(bc(ab(mn)c)cd)/g; var str = 'acbvabcmmabcabmnccd'; reg.exec(str) //则返回: ["bcabmnccd", "bcabmnccd", "abmnc", "mn", index: 10, input: "acbvabcmmabcabmnccd", groups: undefined]
- 可用于正则的字符串方法
- match()
- 字符串的方法,用于匹配指定字符,返回一个数组,在正则全局匹配时数组中包含的是所有匹配到的元素
- 只用于匹配字符串
- 例:var str = 'ababab'; var result = str.match('ab'); // 返回 ["ab", index: 0, input: "ababab", groups: undefined];和正则的exec一样
- 使用正则来匹配
- 不加全局匹配g;例:var str = 'ababab'; var reg = /'ab'/; var result = str.match(reg); // 返回 ["ab", index: 0, input: "ababab", groups: undefined];和正则的exec一样
- 加上全局匹配g,例:var str = 'ababab'; var reg = /'ab'/g; var result = str.match(reg);// 返回 ['ab', 'ab', 'ab'];即使只匹配到一个,也是返回['ab'],而不会返回和exec一样形式的数组
- split()
- 这是把字符串转为数组的方法,同样可以用来进行正则的匹配,意思为以匹配到的字符对字符串进行分割
- 例如: var str = 'ababab'; var reg = /'ab'/; var result = str.split(reg);// 返回 ['', '', '', ''],这个结果代表以ab进行分割,本身split就会全局匹配
- search()
- 用于检索字符串中指定的字符,返回下标,不会全局查找,只能返回第一个找到的小标,找不到返回-1,和indexOf()类似,只是indexOf()不能用于正则匹配
- 例如: var str = 'ababab'; var reg = /'ab'/; var result = str.search(reg);// 返回 0
- replace(old, new)
- 字符串的方法,两个参数,第一个为要被替换的字符串,第二个参数为替换的字符串,匹配到返回替换后的,匹配不到返回原字符串,第一个参数为字符串,只能替换第一个匹配到的,使用正则加上全局匹配,则会进行全局替换
- 例如: var str = 'ababab'; var reg = /'ab'/g; var result = str.replace(reg, 'c');// 返回 ccc
- 正则的元字符
- .
- 英文状态下的句号,用于匹配除\n(换行符)之外的任意字符
- *
- 表示匹配它前面的字符0个或多个
- +
- 表示匹配它前面的字符1个或多个
- ?
- 表示匹配它前面的字符0个1个
- ^
- ^n表示匹配任何以n开头的字符串
- 例: var reg = /^a/g; 表示匹配以a开头的字符串
- [^a],写在中括号中,则表示匹配非a的字符串
- $
- n$,表示匹配以n结尾的字符串
- {m, n}
- 代表区间,从m到n次
- 例:var reg = /f{3, 6}/g;表示匹配f 3到6次;
- f{m},表示匹配f只能m次
- f{m,}表示匹配f只能m次或m次以上
- [a - z]
- 表示匹配a - z之间的任意字母
- [abc]表示匹配方括号之间的任意字母
- [^abc]表示查找不在中括号之间的字符
- [0 - 9]表示从0到9之间的数字
- [A - Z]表示查找大写的A - Z之间的任意字母
- [\u4e00-\u9fa5]匹配中文
- (abc)
- 表示分组成为一个整体
- (a|b|c)表示a或b或c
- ?=n
- 匹配任何其后紧跟指定字符n的字符串
- |
- 或
- \
- 转义,因为正则会对元字符进行解析,如果需要匹配输出,则需要对其进行转义
- 例如:\w代表数字字母下划线,但是想匹配\w则需要写成\\\\w(这是两个杠,由于markdown语法原因,不同设备上可能看到的不一样)
- ?!n
- 匹配任何其后没有紧跟指定字符n的字符串
- \w或\W
- \w表示匹配数字字母下划线
- \W表示非数字字母下划线
- \d或\D
- \d表示匹配0-9的任意数字(不包括负数,小数)
- \D表示非数字
- \s或\S
- \s表示匹配空白字符
- \S表示匹配非空白字符
- \b或\B
- \b表示匹配单词边界
- \B表示匹配非单词边界
- \n
- 匹配换行符
- \r
- 匹配回车符
- 例:匹配手机号
- var value = document.getElementByid('inp').value; // 获取input输入框的value
- var reg = /^1[345678]\d{9}$/; // 表示以1开头,第二位为345678的任意一位数字,剩下的为0-9的数字,取9位,刚好十一位
- var result = reg.test(value);
- 匹配中文
- var reg = /[^\u4e00-\u9fa5]/;