一、 正则表达式是什么?有什么用?
也叫规则表达式,符合规则放行,不符合规则的拒绝
表单验证
在登录或注册或者有表单,需要验证的时候使用
#二、创建正则表达式对象
-
字面量方式
var reg = /js/; // 此正则用来匹配一个字符串是否包含'js'
var str = 'aaaaaajsaaaaaa';
reg.test(str); // 用来test来验证str是否符合规则 -
new关键字
var reg = new RegExp('js','i'); // i-不区分大小写,g-全局匹配,m-多行匹配
var str = 'aajsaa';
var str2 = 'aaJSaa';
console.log(reg.test(str)); // true
console.log(reg.test(str2)); // true -
字符串全局替换
// 字符串全局替换的方法
str = '我们是程序员,程序员是个奇怪的存在';
var newStr = str.replace(/程序员/g,'程序猿');
console.log(newStr);
#(三) 常用匹配规则
#(一)、元字符
字母,数字都属于元字符
^ 匹配字符串的开始
$ 匹配字符串的结束
任意字符 .
\w 字母、数字、下划线
\s 任意空白字符
\d 匹配数字,等同于[0-9]
\D 匹配非数字,等同于0-9
-
| 或匹配,如 /x|y/ 正则可匹配x或y两个字符
/^1(3|4|5|6|7|8|9)\d\d\d\d\d\d\d\d\d$/
/13|14/ [abc] 表示 包含里面的任意一个 一个[]表示一个字符,a,b,c任意一个都符合要求
/^1[3456789]\d\d\d\d\d\d\d\d\d/
#(二)、反义字符
[^x] 匹配除“x”之外的所有字符,其中“x”可以为任意字符
[^xyz] 同上,匹配除“x、y、z”之外的任意字符
#(三)、重复匹配
-
?重复出现零次或一次
/^(+86)?1[3456789]\d\d\d\d\d\d\d\d\d$/
-
- 重复出现一次或多次
/^\d+$/ // 可以是1个数字或者多个数字
-
- 重复出现零次或多次
/^abc\d*$/ // abc后面可以跟0个或多个数字
-
{n} 重复出现n次
/^1[3-9]\d{9}$/ // 后面必须有9个数字
{n,} 至少重复出现n次
{m,n} 重复重现m到n次,其中,m
#(四) 分组
每个分组将产生分组号,从第一个括号开始,可以使用\n的形式在正则中使用分组号, 如匹配成对出现的HTML标签,可以写成:
/<(\w+)>\1>/
在字符串替换中使用分组
var str = '15013795539';
var newStr = str.replace(/(\d{3}\d{4})(\d{4})/,'*******$2');
console.log(newStr);
#(五) 惰性匹配
非惰性匹配: 能匹配多长就匹配多长
惰性匹配: 能少匹配就少匹配
var str = '我们是web前端开发工程师';
var reg = /web.*/
str.match(reg)
#(六) 字符串方法和正则
replace,match等字符串方法都可以使用正则
-
将下文所有 '程序员' 替换成 '程序猿'
程序员(英文Programmer)是从事程序开发、程序维护的专业人员。一般将程序员分为程序设计人员和程序编码人员,但两者的界限并不非常清楚,特别是在中国。软件从业人员分为初级程序员、中级程序员、高级程序员(现为软件设计师)、系统分析员,系统架构师,测试工程师六大类。
-
使用match把网页中的图片筛选出来,match方法会把匹配到的数据放入一个数组 数据所在地方: https://m.sdyxmall.com/v1/#/product/66430440
str =
{"status":0,"data":{"desc":"\u003cp\u003e\u003cimg style=\"width: 750px; height: 704px;\" src=\"https://mall.s.maizuo.com/59ca0d6cf12cc2b99d194a8b68e429f2.png\"\u003e\u003cimg style=\"width: 750px; height: 704px;\" src=\"https://mall.s.maizuo.com/9d55aee4e237a85a0575f3212bfb524c.png\"\u003e\u003cimg style=\"width: 750px; height: 704px;\" src=\"https://mall.s.maizuo.com/9fdd641080def07710b19e04ff52fe79.png\"\u003e\u003cimg style=\"width: 750px; height: 704px;\" src=\"https://mall.s.maizuo.com/affb985cf659ec7a4785b12f1cf28f91.png\"\u003e\u003cimg style=\"width: 750px; height: 704px;\" src=\"https://mall.s.maizuo.com/9bea53b649aea37249d573f7cfe63a0b.png\"\u003e\u003cimg style=\"width: 750px; height: 704px;\" src=\"https://mall.s.maizuo.com/1c6fc6f5857ca053c0631c6ddc4f9521.png\"\u003e\u003cimg style=\"width: 750px; height: 704px;\" src=\"https://mall.s.maizuo.com/5b63fd9ac53d86de6f201c5f80f132d4.png\"\u003e\u003cimg style=\"width: 750px; height: 704px;\" src=\"https://mall.s.maizuo.com/7f9704314415289987a7a249573f21fb.png\"\u003e\u003cimg style=\"width: 750px; height: 708px;\" src=\"https://mall.s.maizuo.com/09ab4a8cf8cbceb373d6ef7fe7c9b875.png\"\u003e\u003cimg style=\"width: 750px; height: 481px;\" src=\"https://mall.s.maizuo.com/9c69475947f48a13be89d24189c7360b.png\"\u003e\u003cimg style=\"width: 750px; height: 219px;\" src=\"https://mall.s.maizuo.com/41dba4b3392994c28189b33ab4981d14.png\"\u003e\u003cbr\u003e\u003c/p\u003e"},"msg":"success"}
;
str.match(/https.*?(jpg|png)/g);
// 解读以下正则表达式
日期 /^1-20-9-[0-1]{0,1}[0-9]-[0-3]{0,1}[0-9]$/
手机号码 /^(0|86|17951)?(13[0-9]|15[012356789]|166|17[3678]|18[0-9]|14[57])[0-9]{8}$/
身份证 /([1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3})$/
邮箱 /\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*/
网址 /^https?/(([a-zA-Z0-9-])+(.)?)(:\d+)?(/((.)?(?)?=?&?a-zA-Z0-9-?))*$/i
正则表达式简单语法及常用正则表达式
基本符号:
^ 表示匹配字符串的开始位置 (例外 用在中括号中[ ] 时,可以理解为取反,表示不匹配括号中字符串)
$ 表示匹配字符串的结束位置
- 表示匹配 零次到多次
- 表示匹配 一次到多次 (至少有一次)
? 表示匹配零次或一次
. 表示匹配单个字符
| 表示为或者,两项中取一项
( ) 小括号表示匹配括号中全部字符
[ ] 中括号表示匹配括号中一个字符 范围描述 如[0-9 a-z A-Z]
{ } 大括号用于限定匹配次数 如 {n}表示匹配n个字符 {n,}表示至少匹配n个字符 {n,m}表示至少n,最多m
\ 转义字符 如上基本符号匹配都需要转义字符 如 * 表示匹配*号
\w 表示英文字母和数字 \W 非字母和数字
\d 表示数字 \D 非数字
常用的正则表达式(转)
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):\x00-\xff
匹配空行的正则表达式:\n[\s| ]*\r
匹配HTML标记的正则表达式:/<(.)>.\1>|<(.*) />/
匹配首尾空格的正则表达式:(^\s)|(\s$)
匹配IP地址的正则表达式:/(\d+).(\d+).(\d+).(\d+)/g //
匹配Email地址的正则表达式:\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*
匹配网址URL的正则表达式:http://(/[\w-]+.)+[\w-]+(/[\w- ./?%&=]*)?
sql语句:^(select|drop|delete|create|update|insert).*$
1、非负整数:^\d+$
2、正整数:^[0-9]1-9$
3、非正整数:^((-\d+)|(0+))$
4、负整数:^-[0-9]1-9$
5、整数:^-?\d+$
6、非负浮点数:^\d+(.\d+)?$
7、正浮点数:^((0-9)+.[0-9]1-9)|([0-9]1-9.[0-9]+)|([0-9]1-9))$
8、非正浮点数:^((-\d+.\d+)?)|(0+(.0+)?))$
9、负浮点数:^(-((正浮点数正则式)))$
10、英文字符串:^[A-Za-z]+$
11、英文大写串:^[A-Z]+$
12、英文小写串:^[a-z]+$
13、英文字符数字串:^[A-Za-z0-9]+$
14、英数字加下划线串:^\w+$
15、E-mail地址:^[\w-]+(.[\w-]+)*@[\w-]+(.[\w-]+)+$
16、URL:^[a-zA-Z]+://(\w+(-\w+))(.(\w+(-\w+)))(?\s)?$
或:^http://[A-Za-z0-9]+.[A-Za-z0-9]+[/=?%-&_~`@[]':+!](<>"")$
17、邮政编码:^[1-9]\d{5}$
18、中文:^[\u0391-\uFFE5]+$
19、电话号码:^((\d2,3)|(\d{3}-))?(0\d2,3|0\d{2,3}-)?[1-9]\d{6,7}(-\d{1,4})?$
20、手机号码:^((\d2,3)|(\d{3}-))?13\d{9}$
21、双字节字符(包括汉字在内):^\x00-\xff
22、匹配首尾空格:(^\s)|(\s$)(像vbscript那样的trim函数)
23、匹配HTML标记:<(.)>.\1>|<(.*) />
24、匹配空行:\n[\s| ]*\r
25、提取信息中的网络链接:(h|H)(r|R)(e|E)(f|F) *= *('|")?(\w||/|.)+('|"| *|>)?
26、提取信息中的邮件地址:\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*
27、提取信息中的图片链接:(s|S)(r|R)(c|C) *= *('|")?(\w||/|.)+('|"| *|>)?
28、提取信息中的IP地址:(\d+).(\d+).(\d+).(\d+)
29、提取信息中的中国手机号码:(86)013\d{9}
30、提取信息中的中国固定电话号码:(\d3,4|\d{3,4}-|\s)?\d{8}
31、提取信息中的中国电话号码(包括移动和固定电话):(\d3,4|\d{3,4}-|\s)?\d{7,14}
32、提取信息中的中国邮政编码:[1-9]{1}(\d+){5}
33、提取信息中的浮点数(即小数):(-?\d*).?\d+
34、提取信息中的任何数字 :(-?\d*)(.\d+)?
35、IP:(\d+).(\d+).(\d+).(\d+)
36、电话区号:/^0\d{2,3}$/
37、腾讯QQ号:^[1-9]1-9$
38、帐号(字母开头,允许5-16字节,允许字母数字下划线):^a-zA-Z{4,15}$
39、中文、英文、数字及下划线:^[\u4e00-\u9fa5_a-zA-Z0-9]+$