JAVA正则表达式介绍

正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描述在查找文字主体时待匹配的一个或多个字符串。
正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
众所周知,在程序开发中,难免会遇到需要匹配、查找、替换、判断字符串的情况发生,而这些情况有时又比较复杂,如果用纯编码方式解决,往往会浪费程序员的时间及精力。因此,学习及使用正则表达式,便成了解决这一矛盾的主要手段。
大家都知道,正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
自从jdk1.4推出java.util.regex包,就为我们提供了很好的JAVA正则表达式应用平台。
因为正则表达式是一个很庞杂的体系,所以我仅例举些入门的概念,更多的请参阅相关书籍及自行摸索。

常用的语法

字符的取值范围

1.[abc] : 表示可能是a,可能是b,也可能是c。
2.[^abc]: 表示不是a,b,c中的任意一个。
3.[a-zA-Z]: 表示是英文字母。
4.[0-9]:表示是数字简洁的字符表示。

匹配任意的字符

.:匹配任意的字符。
\d:表示数字。
\D:表示非数字。
\s:表示由空字符组成[ \t\n\r\x\f]。
\S:表示由非空字符组成[^\s]。
\w:表示字母、数字、下划线[a-zA-Z0-9_]。
\W:表示不是由字母、数字、下划线组成。

数量表达式

1.?: 表示出现0次或1次。
2.+: 表示出现1次或多次。
3.*: 表示出现0次、1次或多次。
4.{n}:表示出现n次。
5.{n,m}:表示出现n~m次。
6.{n,}:表示出现n次或n次以上。

逻辑表达式

1.XY: 表示X后面跟着Y,这里X和Y分别是正则表达式的一部分。
2.X|Y:表示X或Y,比如"food|f"匹配的是foo(d或f),而"(food)|f"匹配的是food或f。
3.(X):子表达式,将X看做是一个整体。

使用方式

java中提供了两个类来支持正则表达式的操作分别是java.util.regex下的Pattern类和Matcher类。
使用Pattern类进行字符串的拆分,使用的方法是String[] split(CharSequence input)。
使用Matcher类进行字符串的验证和替换,匹配使用的方法是boolean matches(),替换使用的方法是 String replaceAll(String replacement)。
Pattern类的构造方法是私有的所以我们使用以下方法进行实例化。

Pattern p = Pattern.compile("a*b");

Matcher类的实例化依赖Pattern类的对象,如下:

Matcher m = p.matcher("aaaaab");

在实际的开发中,为了方便我们很少直接使用Pattern类或Matcher类,而是使用String类下的方法

1.验证:

boolean matches(String regex)

2.拆分:

String[] split(String regex)

3.替换:

 String replaceAll(String regex, String replacement)

你可能感兴趣的:(JAVA正则表达式介绍)