Java正则表达式 贪婪 勉强 匹配说明 greedy vs ( lazy | reluctant )

问题描述:
String str = "aaa\"bbb\"ccc\"ddd\"eee";
str = str.replaceAll("\" (.*)\"", "@");
此时默认为贪婪匹配模式, 输出结果 str==> aaa@eee

String str = "aaa\"bbb\"ccc\"ddd\"eee";
str = str.replaceAll("\" (.*?)\"", "@");
此时为勉强匹配模式, 输出结果 str==> aaa@ccc@eee

总结:
相信大家已经发现了,java 正则表达式默认用的是greedy贪婪匹配模式既是这种类型
(.*)的最长匹配, 如果需要最短匹配则改为(.*?)既是勉强匹配模式

原理分析:


如果是贪婪匹配模式,正则表达式引擎会一直匹配到字符串最后,当匹配为false时,通过
回溯的方式,倒退找到倒数第一个匹配位置,返回匹配结果

如果是勉强匹配模式,正则表达式引擎会匹配到符合pattern的末尾位置那个字符,然后再往后走一步,发现匹配为false, 又回溯到找到回退的最近一个匹配为true的位置,返回结果

不是很好表达,大家意会下

你可能感兴趣的:(java,正则表达式)