Pattern p = Pattern.compile("需要匹配的正则表达式");
Matcher m = p.matcher("需要匹配的文本");
while(m.find()){ //寻找下一个匹配的子文本
String s = m.group(); //提取
System.out.println(s); //输出
}
正则表达式是文本匹配的一种方法。
一些常用的语法如下:
. - 匹配除换行符以外的所有字符。
\d,\w,\s - 匹配数字、字符、空格。
\D,\W,\S - 匹配非数字、非字符、非空格。
我iHIT - 匹配 我iHIT 整个字符串。
[我Hit] - 匹配 我、H、i、t 中的一个字符。
[a-z] - 匹配 a 到 z 中的一个字母。
[^a我c] - 匹配除了 a、我、c 的其他一个字符。
HIT|hit - 匹配 HIT 或 hit。
加在条件后方,限制条件的匹配次数。
? - 重复 0 次或 1 次。\n* - 重复 0 次或多次。
+ - 重复 1 次或多次。
{n} - 重复 n次。
{n,} - 重复 n次以上。
{m,n} - 重复最少 m 次,最多 n 次。
HIT.*学院 - 匹配任意同时顺次存在HIT和学院的文本。
20[0-9]{2}年 - 匹配包含2000年~2099年任意之一的文本。
一款很好用的在线测试工具:https://c.runoob.com/front-end/854/
import java.util.regex.Matcher; //正则表达式匹配器
import java.util.regex.Pattern; //正则表达式的对象
String.matches("需要匹配的正则表达式");
返回能否被给出的正则表达式全匹配,即没有多余字符。
本示例展示一个投票系统的选项及对应值的生成。
用户输入一个符合形如:“选项1”(数值1)|“选项2”(数值2)|… 的文本,可以生成这样的选项:
如何生成将在2.3节中叙述。
此处我们先判断用户输入的字符串是否合法(符合形如上述要求的字符串):
String str = "“支持”(1)|“反对”(-1)|“弃权”(0)";
String regexp = "(“.*?”\\(-?\\d\\)\\|)*(“.*?”\\(-?\\d\\))";
str.matches(regexp); //true
str = "sadhkjasdkh";
str.matches(regexp); //false
光看能否匹配没有什么用,我们最好还能将其中匹配的部分提取出来,此部分介绍从匹配文本中提取目标文本的方法。
比如提取例子中的选项名“支持”和选项值“1”。
Pattern p = Pattern.compile("需要匹配的正则表达式");
Matcher m = p.matcher("需要匹配的文本");
while(m.find()){ //寻找下一个匹配的子文本
String s = m.group(); //提取
System.out.println(s); //输出
}
仍然使用2.2节投票系统的例子。
其中 options 是一个 Map,其键为选项名,值为选项值。
//传入的字符串为
var str = "“支持”(1)|“反对”(-1)|“弃权”(0)";
var options = new HashMap<String, Integer>();
// 创建 Pattern 对象
// 用于匹配 “支持”(1)
Pattern r = Pattern.compile("(“.*?”\\(-?\\d\\)\\|?)");
// 用于匹配 “支持”
Pattern rp = Pattern.compile("“.*?”");
// 用于匹配 (1)
Pattern rv = Pattern.compile("\\(-?\\d\\)");
// 用于匹配 1
Pattern ri = Pattern.compile("-?\\d");
// 创建 matcher 对象
Matcher m = r.matcher(str);
while(m.find()) {
var s = m.group(); // “支持”(1)
var mp = rp.matcher(s);
mp.find();
var opt = mp.group(); //“支持”
opt = opt.substring(1, opt.length()-1); //支持
var vacm = rv.matcher(s);
vacm.find();
var valm = ri.matcher(vacm.group()); // (1)
valm.find();
var val = Integer.parseInt(valm.group()); //1
options.put(opt, val);
}
return options;
得到的options的结果为: