java正则表达式的捕获组

看书和文档,太复杂了…对形式化的概念真的没感觉.于是自己写了好多例子来尝试.终于搞明白了

在java中正则表达式的捕获组由括号来表示 ,比如:

String regexS = "abc(de)(fg)"

其中(de)和(fg)都是捕获组,那么上面的正则表达式就有两个捕获组.

这玩意是来干嘛的呢?

这个主要是和Pattern和Matcher两个类结合使用的!

还是看个例子(从菜鸟教程上拷贝下来的):

public class RegexMatches
{
    public static void main( String args[] ){

      // 按指定模式在字符串查找
      String line = "This order was placed for QT3000! OK?";
      String pattern = "(\\D*)(\\d+)(.*)";

      // 创建 Pattern 对象
      Pattern r = Pattern.compile(pattern);

      // 现在创建 matcher 对象
      Matcher m = r.matcher(line);
      if (m.find( )) {
         System.out.println("Found value: " + m.group(0) );
         System.out.println("Found value: " + m.group(1) );
         System.out.println("Found value: " + m.group(2) );
         System.out.println("Found value: " + m.group(3) ); //这行是我添加上去的,菜鸟教程上没有,这行对理解挺关键的!
      } else {
         System.out.println("NO MATCH");
      }
   }

再看看输出结果:

Found value: This order was placed for QT3000! OK?
Found value: his order was placed for QT
Found value: 3000
Found value: ! OK?
m.group(0)  里面的这个0很关键, 0代表整个正则表达式在这次匹配中,完整匹配出来的句子
你看m.group(0)得到的结果是:
---->> This order was placed for QT3000! OK?
这个就是"(\\D*)(\\d+)(.*)"所匹配的嘛!
而 m.group(1)  m.group(2)  m.group(3) 又是什么呢?
我们再对照下:
-----------------------------------------------------------
m.group(1)  =   This order was placed for QT
m.group(2)  =   3000
m.group(3)  =   ! OK?
-----------------------------------------------------------
对了!
这个1对应的就是第一个括号(\\D*)匹配出来的内容     
2就是第二个括号(\\d+)匹配出来的内容               
3就是第三个括号(.*)匹配出来的内容,依此类推      


m.group(0) 总是表示整个正则表达式匹配出来的内容!
而1,2,3,4......依次表示的就是捕获组匹配的内容,
捕获到了几组就显示到几, 
一般可又 m.groupCount() 得到,注意这个获得的count是不包含0的
不是说有多少个捕获组就能显示到几组啊,有些捕获组说不定就没不捕获到
/**
   *    |   为什么我要添加一行  System.out.println("Found value: " + m.group(3) ); 呢
   *    |   因为上面实际上匹配到了三个捕获组,有一个没打印出来
   *    |   如果没 m.group(3) 有这对理解捕获组的概念 影响很大
   *    |   到这你应该明白什么叫捕获组了吧
   */
/**
    * |  最后:你也可以在括号内添加个记号(?:pattern)价格问号和冒号,使得m.group(x)方法不获取到这个捕获组
    * |  例如:
    * |        "(\\D*)(?:\\d+)(.*)"
    * |      那么第二个捕获组(\\d+)就不会被记录下来,
    * |      你在使用m.group(2)的时候获得的就不是"3000"而是"! OK?"
    * |      即:
    * |      m.group(1)  =   This order was placed for QT
    * |      m.group(2)  =   ! OK?
    * |     但是注意m.group(0)是不会改变的,依然是"This order was placed for QT3000! OK?"
    * |    m.group(0)  =   This order was placed for QT3000! OK?
*/

你可能感兴趣的:(android学习笔记)