java 正则表达式 捕获_Java正则表达式捕获组索引

捕获和分组

捕获组将 (pattern)创建一个具有捕获属性的组。

您可能经常看到(和使用)的一个相关的对象是(?:pattern),它创建了一个不捕获属性的组,因此命名为non-captureing group。

通常,当您需要重复一系列模式(例如(\.\w+)+)或指定交替应在何处生效(例如^(0*1|1*0)$(^,然后0*1或1*0,然后$)与^0*1|1*0$(^0*1或1*0$))时,通常使用组。

除分组外,捕获组还将记录与捕获组内的模式匹配的文本(pattern)。使用你的榜样,(.*):,.*比赛ABC和:比赛:,由于.*是内捕获组(.*),该文本ABC被记录,捕获组1。

组号

整个模式定义为组号0。

模式中的任何捕获组均从1开始索引。索引由捕获组的左括号的顺序定义。例如,以下模式是所有 5个捕获组:

(group)(?:non-capturing-group)(g(?:ro|u)p( (nested)inside)(another)group)(?=assertion)

|     |                       |          | |      |      ||       |     |

1-----1                       |          | 4------4      |5-------5     |

|          3---------------3              |

2-----------------------------------------2

组号用于\n模式和$n替换字符串中的向后引用。

在其他正则表达式类型(PCRE,Perl)中,它们也可以用于子例程调用中。

您可以使用访问特定组匹配的文本Matcher.group(int group)。可以使用上述规则标识组号。

在某些regex样式(PCRE,Perl)中,有一个分支重置功能,该功能使您可以使用相同的数字来捕获交替不同分支中的组。

组名

在Java 7中,您可以定义一个命名的捕获组 (?pattern),并且可以访问与匹配的内容Matcher.group(String name)。正则表达式更长,但是代码更有意义,因为它表明您正在尝试与正则表达式匹配或提取的内容。

组名用于\k模式和${name}替换字符串中的向后引用。

命名的捕获组仍使用相同的编号方案进行编号,因此也可以通过进行访问Matcher.group(int group)。

在内部,Java的实现只是从名称映射到组号。因此,不能将相同的名称用于2个不同的捕获组。

你可能感兴趣的:(java,正则表达式,捕获)