正则表达式是处理字符串的强大的工具,它不是Java的特性,前端的JavaScript等也有。但是相比于其他老牌的高级语言,如C/C++,这是Java比他们独特的地方。
首先来看一个需求:
一些网站设定了一些制定密码的规则。编写一个方法,检验一个字符串是否合法的密码。假设密码规则如下:
1.密码必须至少有8个字符。
2.密码只能包括字母和数字。
3.密码必须至少有2个数字。
编写一个程序,提示用户输入密码,如果该密码符合规则就显示“合法密码”,否则显示“不合法密码”
不用正则表达式之前,我们可以这样解决:
import java.util.Scanner;
/*
* 功能:检测密码的合法性
* 日期:2016.11.19
*
*/
public class RegexDemo {
public static void main(String[] args) {
Scanner input = new Scanner(System.in);
String password = input.nextLine();
if(true == isValid(password)) {
System.out.println("合法密码格式");
} else {
System.out.println("不合法密码格式");
}
}
public static boolean isValid(String password) {
if(password.length() < 8) {
return false;
} else {
int numberCounter = 0;
for(int i = 0; i < password.length(); i++) {
char c = password.charAt(i);
if(!Character.isLetterOrDigit(c)) {
return false;
}
if(Character.isDigit(c)) {
numberCounter++;
}
}
if(numberCounter < 2) {
return false;
}
}
return true;
}
}
这个算法还不是特别的繁琐,稍微耐性点就会解决。然而正则表达式即将登上舞台,它的诞生就是专为了治理字符串这种的疑难杂症。在正则表达式正式出场之前,我们先从熟悉的String类两个方法开始。
返回值 | 方法头 |
---|---|
String[] | split(String regex) 根据给定正则表达式的匹配拆分此字符串。 |
String[] | split(String regex, int limit) 根据匹配给定的正则表达式来拆分此字符串。 |
这是String类自带的方法,方法里面的参数是一个正则表达式,比如我想把一个带有ip和端口的ip v4地址分割出来,那么用法如下:
public static void main(String[] args) {
String ip = "127.0.0.1:80";
String[] ips = ip.split(":");
System.out.println("IP地址:" + ips[0]);
System.out.println("端口号:" + ips[1]);
}
split()里面的”:”就是一个最简单的正则表达式,下面分别从正则表达式的匹配、替换、分割和获取来了解JAVA正则。
匹配数字案例,用正则表达式来判断字符串中是否全部是数字:
String str = "123456789";
String reg = "\\d+";
boolean b= str.matches(reg);
System.out.println(b);
其中\d是正则表达式的匹配模式,在java中\代表转义符,所以这里\d应该写成”\d”,后边的+是量词,代表前面的匹配出现的次数是一次或多次。其量词类型如下图所示:
匹配手机号码,匹配规则:手机号码必须是11位数,而且必须是13、15、18开头。
String tel = "13628123409";
String telReg = "1[358]\\d{9}";
System.out.println(tel.matches(telReg));
正则变量telReg的表达式中,”1”表示第一位只能是数字1,[358]表示第二位的之可以取”358”中的任意一个,”{9}”表示\d有9位,也就是说数字有几位。
String str = "李彦宏.马云.马化腾";
String reg = "\\.";
String[] arr = str.split(reg);
System.out.println("切割得到的长度是:" + arr.length);
for(final String s : arr) {
System.out.println(s);
}
上诉的正则将字符串中以”.”为界限进行切割,得到一个字符串数组,切割得到的字符串放进字符串数组的元素中,下标从0开始。如上所述,输出的结果是:
切割得到的长度是:3
李彦宏
马云
马化腾
如果字符串是以空格隔开,那么用的正则如下:
String reg = " +";
空白字符一般喜欢用\s来代替,所以如果是空格隔开,那么最好的用法如下:
String rege = "\s+";
匹配规则表如图:
完整的api文档你应该参考:java.util.regex 包下的Pattern类。
如果理解了上面的例子,还想挑战一下稍有难度的需求,那么请看:
把一个二维数组放在字符串里面,从字符串中提取出一个二维数组出来,保存在一个二维数组里面.
输入:
“1, 2; 3, 4, 5; 6, 7, 8, 9”(一个三行列不固定的二维数组,且这个二维数组是在字符串中)
输出:
1.0 2.0
3.0 4.0 5.0
6.0 7.0 8.0 9.0
解题思路:
先用“;”切割字符串,编程一维字符串数组,然后再遍历得到的一维字符串数组,依次将里里面的字符串再次用”.”来切割。具体的实现代码如下:
class StringToArray {
public static void main(String[] args) {
String str = "1, 2; 3, 4, 5; 6, 7, 8, 9";
String[] ss = str.split(";");
for(int i = 0; i < ss.length; i++) {
ss[i] = ss[i].trim();
}
//已经将字符串划分到了一个一维数组里面
//接下来就是每组分别分割成double型的数
double[][] arr = new double[ss.length][];
for(int i = 0; i < ss.length; i++) {
String[] ssChildren = ss[i].split(",");
arr[i] = new double[ssChildren.length];
for(int j = 0; j < ssChildren.length; j++) {
ssChildren[j] = ssChildren[j].trim();
arr[i][j] = Double.valueOf(ssChildren[j]);
}
}
//已经把字符串中的数字都放在二维数组里面了,现在输出
for(int i = 0; i < arr.length; i++) {
for(int j = 0; j < arr[i].length; j++) {
System.out.print(arr[i][j] + "\t");
}
System.out.println();
}
}
}
切割重叠词,将叠词两边的字符串分割出来:
String str = "erkktyqqquizzzzzo";
String reg = "(.)\\1+";
String[] arr = str.split(reg);
System.out.println("切割得到的长度是:" + arr.length);
for(final String s : arr) {
System.out.println(s);
}
将规则封装成一个组。用()完成。组的出现都有编号。从1开始。 想要使用已有的组可以通过 \n(n就是组的编号)的形式来获取。
有这么一个字符串”wer1389980000ty1234564uiod234345675f”,将字符串中的数组替换成#。
public static void replaceAllDemo(String str,String reg,String newStr) {
str = str.replaceAll(reg,newStr);
System.out.println(str);
}
replaceAllDemo(str,"\\d{5,}","#");
操作的步奏是,正则先去匹配字符串,如果找到匹配则替换。
替换叠词,将重叠的字符替换成单个字符,如:tt->t,调用的方法还是如上,传递的字符串和正则规则如下:
String str1 = "寻寻觅觅冷冷清清,凄凄惨惨戚戚,乍暖还寒时候,最难将息";
replaceAllDemo(str1,"(.)\\1+","$1");
“$”匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。李清照的这句词将被分割成”寻觅冷清,凄惨戚,乍暖还寒时候,最难将息”。
正则表达式的第四个功能:获取。将字符串中的符合规则的子串取出。这里必须去了解和使用JAVA封装的两个类:Matcher,Pattern。
String str = "Hello Rgex This is the test text!";
System.out.println(str);
String reg = "\\b[a-z]{4}\\b";
//将规则封装成对象。
Pattern p = Pattern.compile(reg);
//让正则对象和要作用的字符串相关联。获取匹配器对象。
Matcher m = p.matcher(str);
System.out.println(m.matches());
其实String类中的matches方法。用的就是Pattern和Matcher对象来完成的。只不过被String的方法封装后,用起来较为简单。但是功能却单一。
public class RegexDemo {
public static void main(String[] args) {
getDemo();
}
public static void getDemo(){
String str = "Hello,Rgex,This,is,the,test,text!";
System.out.println(str);
String reg = "[a-zA-Z]{2,4}";
//将规则封装成对象。
Pattern p = Pattern.compile(reg);
//让正则对象和要作用的字符串相关联。获取匹配器对象。
Matcher m = p.matcher(str);
while(m.find()) {
String result = m.group();
System.out.println(result);
}
}
}
操作步骤:
1,将正则表达式封装成对象。
2,让正则对象和要操作的字符串相关联。
3,关联后,获取正则匹配引擎。
4,通过引擎对符合规则的子串进行操作,比如取出。