大家好,我是IT修真院深圳分院的学员,一枚正直纯洁善良的JAVA程序员。本次为大家带来关于正则表达式的入门。
1.背景介绍
关于历史
正则表达式一开始是研究人类神经系统工作原理的专家提出的概念,后来正则表达式被引入到计算搜索算法的早期研究中,然后又经过程序圈几十年的发展与迭代,到现在正则表达式已经成为程序语言中不可分割的一部分。如果你是一位接触计算机语言的工作者,那么你会在主流操作系统(*nix[Linux,Unix等]、Windows、HP、BeOS等)、主流的开发语言(delphi、Scala、PHP、C#、Java、C++、Objective-c、Swift、VB、Javascript、Ruby以及Python等)、数以亿万计的各种应用软件中,都可以看到正则表达式优美的舞姿。我们甚至可以说,现在几乎所有的编程语言都支持正则表达式,只是因为语言的不同而略有差异。
关于正则表达式
正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE).
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
通俗的讲就是按照某种规则去匹配符合条件的字符串,而正则表达式定义的就是匹配规则。
2.知识剖析
元字符
(* + ? $ ^ . | \ ( ) { } [ ])
字符类
\w 匹配任何单字符 [a-zA-Z0-9]
\W 匹配任何单字符以外的字符
\d 匹配任何单数字[0-9]
\D 匹配所有数字之外的字符
\s 匹配任何Unicode空白符
\S 匹配任何Unicode空白符之外的字符
[...] 匹配任何方括号之内的字符
[^...] 匹配任何方括号之外的字符
修饰符
1、g:global全文搜索,不添加,搜索到第一个匹配停止;
2、i:ignore case忽略大小写,默认大小写敏感;
3、m:multiple lines多行搜索。
重复:量词
?:出现零次或一次(最多出现一次);
+:出现一次或多次(至少出现一次);
*:出现零次或多次(任意次);
{n}:出现n次;
{n,m}:出现n到m次;
{n,}:至少出现n次。
反义 :[^]
分组:使用()可以达到分组的功能,使用量词作用于分组
字符转义:使用\可以达到字符转义的功能
分枝条件:使用|可以达到分支的功能,约等于java里面的或者
贪婪与懒惰:在量词后面加上?会变成非贪婪模式.
后向引用
零宽断言
负向零宽断言
处理选项
平衡组/递归匹配
关于正则表达式引擎
正则引擎主要可以分为两大类:一种是DFA,一种是NFA。这两种引擎都有了很久的历史(至今二十多年),当中也由这两种引擎产生了很多变体!于是POSIX的出台规避了不必要变体的继续产生。这样一来,主流的正则引擎又分为3类:一、DFA,二、传统型NFA,三、POSIX NFA。
3.常见问题
1.读不懂正则表达式怎么办?
2.正则表达式在java中如何运用。
4.解决方案
1.读不懂正则表达式怎么办?正则表达式可视化工具:http://regexper.com
正则表达式可视化工具:http://regexper.com
一般来说,正则表达式只是用来写的,基本上写完,完成预期的功能后,作者就已经不知道该怎么读自己写的正则表达式了。
2.正则表达式在java中如何运用。
java.util.regex 包主要包括以下三个类:
Pattern 类:
pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern对象。该方法接受一个正则表达式作为它的第一个参数。
Matcher 类:
Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher对象。
PatternSyntaxException:
PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。
5.编码实战
6.扩展思考
正则表达式这么强,我们应该怎么用?
上帝的归上帝,正则的归正则,分工明确。
7.参考文献
链接:http://deerchao.net/tutorials/regex/regex.htm
作者:deerchao
链接:https://juejin.im/post/582dfcfda22b9d006b726d11
作者:水墨寒湘
8.更多讨论
1.正则表达式在linux的shell脚本中有哪些命令可以使用?
sed命令.awk命令和grep命令都可以使用正则表达式。
2.怎么是用这个东西显示的,什么网页?
关于正则表达式的可视化工具:https://regexper.com/。这个网站是可以安装到本地的,由GitHub管理源码。
3.使用正则判断输入的邮箱符合格式是否正确。
\\w+([+.-]\\w+)*@\\w+([.-]\\w+)*\\[^\n\r\x85\u2028\u2029]\\w+([.-]\\w+)*
PPT链接:戳这里看PPT
腾讯视频:腾讯视频
技能树.IT修真院
“我们相信人人都可以成为一个工程师,现在开始,找个师兄,带你入门,掌控自己学习的节奏,学习的路上不再迷茫”。
这里是技能树.IT修真院,成千上万的师兄在这里找到了自己的学习路线,学习透明化,成长可见化,师兄1对1免费指导。快来与我一起学习吧
直接点击此链接:http://www.jnshu.com/login/1/10985551