\b 开始和结尾
.任意字符
*循环多次,任意数量
.*那就表示很多个任意字符
\d一个数字,同[0-9]意思一样
{i}表示循环i次 \d{5}表示5个连在一起的数字\d{2,6}大于2个小于6个的几个数字,\d{2,}表示大于2个的那些数字
|或者,匹配电话号码 (\d{3}|\d{4})-\d{8}
\w在\d上的扩展,包括数字和字母,找以a开头的单词 \ba\w*\b,找6个字母的单词\b\w{6}\b
\s空白符号 空格 制表符 回车等
+作用和*基本相同,+必须匹配>0 *>=0
^字符串的开始
$字符串的结尾 同\b不同,\b只是个分隔符,^$是精确匹配,检查QQ是否为5-12位的数字 ^/d{5,12}$
字符转义同JAVA的相同,都是用\,表示纯粹意义上的特殊字符,表示*,\.表示.
\w*宇\w+区别?不同?
表示重复的除了*,+,{}还有?,表示重复0次或1次
[]表示[]中的值中的任意一个,\d同[0-9],\w同[a-zA-Z0-9],
匹配029-1111111或0491111111或(051)11111111或023 22222222的电话号码\(?0\d{2}[)- ]?\d{8}
(也表示特殊的东西
|两边的一个满足就可以,但这里有次序问题,匹配09876或09876-9876写成\d{5}|\d{5}-\d{4}就可以,写成\d{5}|(\d{5}-\d{4})就不行,当然这个情况比较特殊,匹配是从左到右,如果左边满足右边就不去管了,匹配09876或0987-9876写成\d{5}|(\d{4}-\d{4})或写成(\d{5}-\d{4})|\d{5}都可以.
如果想对多个在一起循环,就要加(),比如简单IP地址匹配,(\d{1,3}\.){3}\{1,3},写法:([0-255]\.){3}\[0-255]也不对,0-255按分段来,([0-1]?\d\d?|2[0-2]\d|25[0-5]\.){3}([0-1]?\d\d?|2[0-2]\d|25[0-5]),0-255可由0-199,200-249\250-255组成.
\W,\S,\D,\B都是反义字符,匹配非数字或字母的字符,匹配非空白符的字符,匹配非数字,匹配不是单词开头或结尾的位置...
[^x]匹配除了x外的任意字符,[^aoeio]匹配除了aoeiu外的任意字符,如要匹配不含空白符的字符串,\S+,匹配用尖括号括起来的以a开头的字符串,<a[^>]+>
后向引用,用小括号括起来的可以取个别名,或系统默认给了名字,以后使用可以直接使用,如匹配重复的单词,\b(\w+)\b\s+\1\b
java在jdk1.4引入正则,Pattern,Matcher:
p表达式,m匹配,
String str = "href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮"; Pattern pattern = Pattern.compile("\\?(id=)(\\d+)&page=(\\d{0,4})",Pattern.CASE_INSENSITIVE); Matcher matcher = pattern.matcher(str);
m匹配之后主要操作有查找,替换
1.查找
while(m.find()){ System.out.println(m.group()); System.out.println(m.start(0));//返回匹配的开始位置 System.out.println(m.end(0));//返回匹配的结束位置 }找到之后的操作,m的find之后紧接着的group,start,end都是一体的,java的正则都是基于正则里有组的,group就是组,默认是group(0),group1是(id=),group2是(\\d),group3是(\\d{0,4})匹配上就是group(0),可对匹配上的组里的元素进行操作。start(group),end(group)表示匹配上的元素的定位开始结束位置,
System.out.println(m.groupCount()); System.out.println(m.pattern());还有两个方法m.matches() ,m.lookingAt(),matches()是p编译的正则与字符串str完全匹配返回true,lookingAt()是字符串str的开始部分与p编译的正则匹配就返回true:
System.out.println(m.matches());//false System.out.println(m.lookingAt());//false m.reset("?id=27239&page=1"); System.out.println(m.matches());//true System.out.println(m.lookingAt());//true m.reset("?id=27239&page=1d"); System.out.println(m.matches());//false System.out.println(m.lookingAt());//true
m.reset(str)重置要匹配的字符序列,reset的是要匹配的字符序列。
2.替换
替换有替换全部但替换部分replacement不可变的replaceAll(replacement),和替换第一个但替换部分replacement不可变的replaceFirst(replacement),都返回一个替换后的字符串。另外有替换内容是动态可变的替换m.appendReplacement(StringBuffer sb, String replacement)和m.appendTail(StringBuffer sb),appendReplacement当find()为ture的时候,它把上一次替换到本次匹配字符串被替换之间的字符赋给sb并返回。appendTail是当appendReplacement替换后把剩余的部分存放在sb并返回,所以动态替换这部分由appendReplacement和appendTail构成。
m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮"); System.out.println(m.replaceAll("hello"));//href="hello"李三href="hello"李广亮 System.out.println(m.replaceFirst("hello"));//href="hello"李三href="?id=27531&page=2"李广亮
m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮"); StringBuffer appendSb = new StringBuffer(); StringBuffer appendSb2 = new StringBuffer(); int i=1; while(m.find()){ m.appendReplacement(appendSb, "变"+i);//href="变0"李三href="变1 m.appendTail(appendSb2); System.out.println("第"+i+"次"+appendSb); System.out.println("第"+i+"次"+appendSb2); i++; } System.out.println(appendSb.toString()); System.out.println(appendSb2.toString()); //输出: //第1次href="变1 //第1次"李三href="?id=27531&page=2"李广亮 //第2次href="变1"李三href="变2 //第2次"李三href="?id=27531&page=2"李广亮"李广亮 //href="变1"李三href="变2"李广亮 //"李三href="?id=27531&page=2"李广亮"李广亮如果输出动态替换后完整的:
m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮"); StringBuffer appendSb = new StringBuffer(); int i=1; while(m.find()){ m.appendReplacement(appendSb, "变"+i); i++; } m.appendTail(appendSb); System.out.println(appendSb.toString()); //href="变1"李三href="变2"李广亮再说说p,p的split(CharSequence input)方法也常用,分离字符串数组。
package kpw; import java.util.regex.Matcher; import java.util.regex.Pattern; public class AA { /** * @param args */ public static void main(String[] args) { String str = "href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮"; Pattern p = Pattern.compile("\\?(id=)(\\d+)&page=(\\d{0,4})",Pattern.CASE_INSENSITIVE); Matcher m = p.matcher(str); while(m.find()){ System.out.println(m.group()); System.out.println(m.start(0));//返回匹配的开始位置 System.out.println(m.end(0));//返回匹配的结束位置 } System.out.println(m.groupCount()); System.out.println(m.pattern()); System.out.println(m.matches());//false System.out.println(m.lookingAt());//false m.reset("?id=27239&page=1"); System.out.println(m.matches());//true System.out.println(m.lookingAt());//true m.reset("?id=27239&page=1d"); System.out.println(m.matches());//false System.out.println(m.lookingAt());//true m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮"); System.out.println(m.replaceAll("hello"));//href="hello"李三href="hello"李广亮 System.out.println(m.replaceFirst("hello"));//href="hello"李三href="?id=27531&page=2"李广亮 m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮"); StringBuffer appendSb = new StringBuffer(); int i=1; while(m.find()){ m.appendReplacement(appendSb, "变"+i); i++; } m.appendTail(appendSb); System.out.println(appendSb.toString()); //第1次href="变1 //第1次"李三href="?id=27531&page=2"李广亮 //第2次href="变1"李三href="变2 //第2次"李三href="?id=27531&page=2"李广亮"李广亮 //href="变1"李三href="变2"李广亮 //"李三href="?id=27531&page=2"李广亮"李广亮 p.split(""); String strhhh="fdsjdlfksaj<!--dfsjkjlfds-->jldjfljkdflsadf"; System.out.println(strhhh.indexOf("<!--")); System.out.println(strhhh.indexOf("-->")); } }