JAVA正则表达式-捕获组与非捕获组

转载自: http://mcj8089.iteye.com/blog/1183075

  Java捕获组与非捕获组的问题困扰了我一阵子,下面是我弄明白后的笔记:

先看例子:

import java.util.regex.Matcher;  
import java.util.regex.Pattern;  

public class PatternTest {  
    public static void main(String[] args) {  
        String text = "";  
        String reg = ".*?";  
        Pattern p = Pattern.compile(reg);  
        Matcher m = p.matcher(text);  
        while (m.find()) {  
            System.out.println(m.group());  
        }  
    }  

}  

运行结果:

<textarea rows="20" cols="70">nexus maven repository index properties updating index centraltextarea>  

   现在,如果我只想匹配到内的文本内容即“nexus maven repository index properties updating index central”,怎么做呢?这时候就要用到捕获组了。上述代码中“

import java.util.regex.Matcher;  
import java.util.regex.Pattern;  

public class PatternTest {  
    public static void main(String[] args) {  
        String text = "";  
        //下面的正则表达式中共有四个捕获组:()、(.*?)、()和整个匹配到的内容  
        String reg = "()(.*?)()";    
        Pattern p = Pattern.compile(reg);  
        Matcher m = p.matcher(text);  
        while (m.find()) {  
            System.out.println(m.group(0)); // 整个匹配到的内容  
            System.out.println(m.group(1)); // ()  
            System.out.println(m.group(2)); // (.*?)  
            System.out.println(m.group(3)); // ()  
        }  
    }  
}  

运行结果:

<textarea rows="20" cols="70">nexus maven repository index properties updating index centraltextarea>  
<textarea rows="20" cols="70">  
nexus maven repository index properties updating index central  
textarea>  

   从上述代码得出结论:正则表达式中每个”()”内的部分算作一个捕获组,每个捕获组都有一个编号,从1,2…,编号0代表整个匹配到的内容。
  至于非捕获组,只需要将捕获组中”()”变为”(?:)”即可,代码说话:

import java.util.regex.Matcher;  
import java.util.regex.Pattern;  

public class PatternTest {  

    public static void main(String[] args) {  
        String text = "";  
        // 下面的正则表达式中共有二个捕获组:(.*?)和整个匹配到的内容,两个非捕获组:(?:)和(?:)  
        String reg = "(?:)(.*?)(?:)";  
        Pattern p = Pattern.compile(reg);  
        Matcher m = p.matcher(text);  
        while (m.find()) {  
            System.out.println(m.group(0)); // 整个匹配到的内容  
            System.out.println(m.group(1)); // (.*?)  
        }  
    }  
}  

运行结果:

  
nexus maven repository index properties updating index central  

如果试图运行:System.out.println(m.group(2));将会抛出异常,因为不存在编号为2的捕获组。

  还有方便的写法 ()(?.*?)() 在正则表达式中加一个变量 data 然后在 group 获取 string str = m.group(“data”);



.*? 在这里是非贪婪模式,即最短匹配,比如说字符串 aabab,什么都不加,默认贪婪模式,a.*b 能匹配abab,非贪婪模式,加?号,a.*?b能匹配aab和ab;

你可能感兴趣的:(JAVA正则表达式,JAVA基础)