蕾拉聊以色列

php邮箱正则下划线,正则表达式-邮箱正则解析引导

1，强推一个github上学习正则的项目

2，常见的邮箱格式

1，数字 + @ + 数字 + .com：[email protected]

2，数字、字母 + 下划线 + @ + 数字|字母 + .com：zhangsan_123@163(qq).com

3，数字、字母、下划线 + @ + 数字、字母、中划线- + .com：[email protected]

补充说明：为了下文便于理解，假定上述邮箱字符串作以下拆分：

1)第一部分：@符号之前的内容

2)第二部分：@符号之后，.符号之前的部分

3)第三部分：.符号之后的部分(虽然上述链接格式是以顶级域名com为结尾，但并不排除出现类似.com.cn这样的结构)

3，正则解析

3.0，前言

1，基于每个人的思维模式，理解能力等因素，为了使您的正则学习不误入歧途，请确保在参考了一定资料(如菜鸟教程、或是上述推荐的github项目)之后，有了初步的基础后，再参考本文，作进一步的参考印证会更好一点，请认真考虑我的提议！

2，本文适合正则初学者阅读；本意还是为了引导初学者在学习过程中如何去思考构造及优化正则表达式；本文所用的例子并不一定全部涵盖现实中所有的邮箱格式。

故在阅读过程中，希望您可以尝试考虑本文没有提及的地方，以及该如何优化？同时，也欢迎您在下方留言处予以指正，非常感谢！

3，本文篇幅略长，您最好是有时间了跟着操作一遍比较好。

4，部分元字符因为偷懒的缘故，并未一一列出，请综合参考各方资料。

3.1，思考题：如何(仅)匹配数字或字母其中一种情况？

1，会的同学请略过

2，相关元字符：

\d - 表示[0-9]的整数数字；

\w - 表示字母、数字、下划线

+ - 表示该符号(即符号+)前出现的子表达式需要至少出现1次；

* - 表示该符号前出现的子表达式需要至少出现0次

？ - 表示该字符前出现的子表达式可以出现0次或1次

^ - 匹配输入字符的开始位置

$ - 匹配输入字符的结束位置

?: - 匹配 pattern 但不获取匹配结果

x|y: - 匹配x或匹配y

针对上述思考题，我将尝试分步进行校验：

1)如何仅匹配数字？

匹配单个整数的元字符是\d，匹配多个整数数字字符串可以用\d+(当然，*其实也是可以的，显然元字符+的匹配结果是元字符*的匹配结果的子集)；那如何保证整个字符串只能出现数字呢？答案是用元字符^和$去限制输入值；

也即是说，^与\d结合告诉程序需要排除输入字符的开始位置不为数字的情况($符号同理)。

同时满足这两个限制才会输出匹配结果(至于中间不为数字的情况嘛，该表达式走不下去，因为当判断到非数字的情况的时候，意味着\d+匹配结束，然后$符号发现结束位置不为数字，匹配失败；您可以试着解除$元字符的限制，看看中间不为数字的匹配结果)。

2)如何仅匹配字母？

构造过程同上。需要注意的是，在当前限制下，\w不再适合用来匹配字母，因为\w同时还能匹配数字和下划线。

所以我尝试将之替换为[a-zA-Z]。

3)如何(仅)匹配数字或字母其中一种情况？

将前两步的结果，构造成x|y形式。

4)针对第3步的结果，该如何优化？

需要提醒的是，由于第3步中，我将第1步和第2步中的结果组成了“x|y”这种形式，为了不使这两个子表达式造成歧义，我用了两个小括号将其包裹起来；

于是我面临了一个问题：由于小括号除了通俗意义上的隔离、提高优先级等作用外；它在正则里还有一个作用是收集并存储括号内子表达式的匹配结果。因此，当我并不需要这个子表达式的匹配结果时，我可以用元字符“?:”来实现这个想法。当然，如果您需要用到的话，则并不需要考虑?:元字符的作用。

3.2，数字 + @ + 数字 + .com类：