1 用途:
字符串匹配
字符串查找
字符串替换
例如:验证ip是否正确 网页中揪出email 网页中揪出链接
类:java.lang.String java.util.regex.Pattern java.util.regex.Matcher
2 String类型里面有两个方法:mathces和replaceAll。
Pattern中有compile方法
Matcher中有matchers方法
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test { public static void main(String[] args) { System.out.println("abc".matches("..."));//返回true System.out.println("we3223def".replaceAll("\\d", "-"));//把数字全部替换成“-” Pattern p = Pattern.compile("[a-z]{3}");//把正则表达式编译一下,以便提高速度 Matcher mathcer = p.matcher("dsd");//用已经编译的正则表达式去匹配字符串。产生的结果存到匹配器中 System.out.println(mathcer.matches());//把是否匹配用boolean类型打印出来。 } }
3 认识 . * + ?
参考 :java1.5 帮助文档Pattern
public class Test2 { public static void main(String[] args) { //认识 . * + ? //. 任何字符 //* 前面内容0个或多个 //+ 前面内容1个或多个 //? 前面内容0或1 System.out.println("a".matches(".")); System.out.println("aa".matches("aa")); System.out.println("aaaa".matches("a*")); System.out.println("aaaa".matches("a+")); System.out.println("".matches("a*"));//true System.out.println("".matches("a?"));//true System.out.println("a".matches("a?"));//true System.out.println("23425342".matches("\\d{3,100}")); System.out.println("192.168.0.aa".matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}")); System.out.println("192".matches("[1-2][0-9][0-9]")); } }
4 范围表述:[]
一个中括号代表匹配一个字符。
^取反 -范围 |交集 &并集
[sdv]表述取其中的某一个即可。
[^sef]表述去除了其中的内容。其他都可以
[a-z]表述从a到z
[a-zA-Z] 表述从a到z或从A到Z
[a-z]|[A-Z] 也是表述从a到z或从A到Z
[a-z[A-z]] 同上
[A-z&&[RFG]] 表述从A到Z且在[]其中的
5 认识\s \w \d \
\d 代表一位数字
\D 代表非数字
\s 代表空白字符:如空格 制表符 回车 等
\S 代表非空白字符
\w 代表名称字符:字母 数字 下划线
\W 代表非名称字符
\ 代表转译字符。
特别注意:当要判断"\"时,在java中表述变为"\\"。用正则表达式去匹配就应该为"\\",但还要用java的中去表述出来,即为"\\\\".综上所述:"\\".matches("\\\\")为true。其实要表达的意思是“\”用正则表达式“\\”来匹配。
6 POSIX (用的不多)
\p{Lower} 小写字母字符:[a-z]
\p{Upper} 大写字母字符:[A-Z]
\p{ASCII} 所有 ASCII:[\x00-\x7F]
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]
\p{Digit} 十进制数字:[0-9]
\p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]
\p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
\p{Graph} 可见字符:[\p{Alnum}\p{Punct}]
\p{Print} 可打印字符:[\p{Graph}\x20]
\p{Blank} 空格或制表符:[ \t]
\p{Cntrl} 控制字符:[\x00-\x1F\x7F]
\p{XDigit} 十六进制数字:[0-9a-fA-F]
\p{Space} 空白字符:[ \t\n\x0B\f\r]
7 边界匹配:
^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾,仅用于最后的结束符(如果有的话)
\z 输入的结尾
public class Test3 { public static void main(String[] args) { System.out.println("hello sir".matches("^h.*"));//true System.out.println("hello sir".matches(".*ir$"));//true // \b表示单纯边界 System.out.println("hello sir".matches("^h[a-z]{1,3}o\\b.*"));//true System.out.println("hellosir".matches("^h[a-z]{1,3}o\\b.*"));//false System.out.println(" \n".matches("^[\\s&&[^\\n]]*\\n$"));//验证是否是“空白行”,true } }
8 有管Patter和Matcher的方法介绍:
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test4 { public static void main(String[] args) { Pattern pattern = Pattern.compile("\\d{3,5}"); String s = "123-321-3214-32"; Matcher m = pattern.matcher(s); System.out.println(m.matches());//false 记得是要全面匹配 m.reset();//把mathcer回复回去.让吃掉的内容恢复从原来的样子 //matcher的find的方法是从字符串中查找是否有符合要求的字符子串。然后把已经匹配的吃掉 System.out.println(m.find());//true System.out.println(m.start()+"-"+m.end());//0-3 System.out.println(m.find());//true System.out.println(m.start()+"-"+m.end());//4-7 System.out.println(m.find());//true System.out.println(m.start()+"-"+m.end());//8-12 System.out.println(m.find());//false //只有在能够找到子串的情况下才能使用start()和end()。否则报错 //System.out.println(m.start()+"-"+m.end()); //matcher的longingAt的方法是从字符串的开始查找是否有符合要在的字符字串。 System.out.println(m.lookingAt());//true //字符串的替换 Pattern pa = Pattern.compile("java",Pattern.CASE_INSENSITIVE);//后面的意思是忽略大小写 String st = "java java ILoveJava YouHateJava"; Matcher mm = pa.matcher(st); System.out.println(mm.replaceAll("JAVA")); } }
9 分组:在正则表达式中加入(),即可完成分组。0为整个字符串,1...为相应顺序的分组。
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test5 { public static void main(String[] args) { Pattern pa = Pattern.compile("(\\d{3,5})([a-z]{2})"); Matcher m = pa.matcher("123dw-31243bf-3243"); System.out.println(m.matches());//false m.reset(); while(m.find()){ System.out.println("-----"); System.out.println(m.group());//默认为0 即全组 System.out.println(m.group(1)); System.out.println(m.group(2)); } } }