《Java编程十五讲》第八讲:正则表达式

第八讲 正则表达式
正则表达式(regular expression)定义了一种文本搜索模式。正则表达式在文本的搜索编辑的场景中很有用处。

正则表达式并不是在Java中首次出现的,可以说很久以前就出现了。19世纪50年代,由美国数学家Stephen Cole Kleene提出,后来随着UNIX的普及,它从左往右逐个字符扫描文本,找到匹配的模式,继续往下扫描,模式可以使用一次或者多次。JDK 1.4版本开始支持了。

实际上,我们不用编写程序就在使用正则表达式了。一个例子就是在命令窗口执行命令“dir *.txt”或者“dir test?.txt”,这样可以找出符合这个模式的文件。

Java里面有一个util.regex包,常用下面两个类。

util.regex.Pattern:用于定义模式。
util.regex.Matcher:用于使用模式进行文本匹配操作。
JDK文档中有一个简单例子:

Pattern p = Pattern.compile("ab");
Matcher m = p.matcher(“aaaaab”);
boolean b = m.matches();
结果是返回true。模式a
b代表的是以a开头b结尾中间有零个或者多个字符的一切串。因此,按照这个模式去搜索,aaaaab是符合条件的。

更简单的写法就是“boolean b = Pattern.matches(“a*b”, “aaaaab”);”,不过这种写法性能不高,无法重用pattern对象。如果只用一次,那么可以这样简写。

再看一个识别数值的例子。

Pattern pattern = Pattern.compile("^\\d+(\\.\\d+)?");
Matcher matcher = pattern.matcher("5.67");
boolean b = matcher.matches();

结果返回true。模式^\d+(.\d+)?代表的是以一个或多个数字开头,后面可以跟一个点号(.),之后再跟一个或多个数字。因此,5.67, 5, 3.5都符合,但是

你可能感兴趣的:(读九章学Python)