多行匹配正则表达式写法

1 多行匹配
2 不以某某开头，比如不以www开头
3 不区分大小写
4 2个单元的或操作，比如 www | 3w 都可以这种

1：多行匹配

在默认的情况下 . 是不能匹配行结束符的（行结束符有 6 个，具体的可以看看 Pattern 的 API DOC）
同样，可以像不匹配大小写匹配那样使用编译参数：Pattern.DOTALL

如果还得区分大小写的话，还得加上上面说到的 Pattern.CASE_INSENSITIVE 这个，举个例子：

Java代码：
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class Test {

public static void main(String[] args) {
String str =
"

\n" +
" \n" +
" \n" +
" \n" +
"

\n" +
" Hello World! \n" +
"

";
String regex = "(.+?)";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
while(matcher.find()) {
System.out.println(matcher.group(1).trim());
}
}
}
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class Test {
public static void main(String[] args) {
String str =
" \n" +
" \n" +
" \n" +
" \n" +
"

\n" +
" Hello World! \n" +
"

";
String regex = "(.+?)";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
while(matcher.find()) {
System.out.println(matcher.group(1).trim());
}
}
}

上面这个是不能从 str 抽取出东西的，因为 td 的后面带有换行符，我们只要更改一下：

Pattern pattern = Pattern.compile(regex, Pattern.DOTALL);

这样就行了，如果 td 还得不区分大小写的话，再改成：

Pattern pattern = Pattern.compile(regex, Pattern.DOTALL | Pattern.CASE_INSENSITIVE);

这样的话，td 哪怕是大写的这个表达式都能把 td 之间的字符区抽取出来。

当然和 Pattern.CASE_INSENSITIVE 一样，Pattern.DOTALL 也有内嵌标志表达式，即 (?s)
s 的意思表示 single-line 就是忽略换行符什么的，只看成单行进行处理。

这个表达式使用内嵌 (?s) 的话可以改为：

String regex = "(?s)(.+?)";

如果还要不区分大小写的话，再加上 i 标志：
String regex = "(?s)(?i)(.+?)";

但这样显得很拖沓，可以把它们合并起来：
String regex = "(?is)(.+?)"; // 秩序无所谓

最后需要说明一下的是，我曾看到过由于不明白 DOTALL，为了让 . 匹配行结束符，直接把表达式写成：

String regex = "((.|\\s)+?)";

这样做是极其危险的，由于选择结构的匹配效率问题，这样做在比较长的字符串时会造成堆栈溢出，
使程序崩溃，如果使用 DOTALL 或者 (?s) 的话就不会出现这种情况。

多行匹配正则表达式写法

你可能感兴趣的:(正则表达式)