关于‘[’‘]’在正则表达式中的匹配

最近在“问答”频道上看到这样的问题:

 

写道
test123[em:23:]5678[em:4:]

取出中括号中的数字

 

 

很显然大概的正则表达式应该是:[em:(\\d+):]

 

测试时,出问题了。问题出在‘[’‘]’。因为它们是正则表达式中的特殊字符。

 

试试转义,失败了。试试用Pattern的compile方法,编译含有[]的正则表达式,也失败了。

 

。。。。

 

最后,查看API(真是个好东西),发现了突破口-- 使用Unicode。

 

	@Test
	public void testRegx4() {

		String source = "test123[em:23:]5678[em:4:]";

		Pattern pattern = Pattern.compile("\\u005Bem:(\\d+):\\u005D");

		Matcher matcher = pattern.matcher(source);
		
		System.out.println("取得数字:");

		while(matcher.find()){
			System.out.println("找到:"+matcher.group(1));
		}

	}

 

 

终于,成功了。记录一下!

 

PS:还进行了更大胆的尝试,将正则表达式中的所有字符都替换为Unicode码,结果依然正确!

 

 

 

 

你可能感兴趣的:(正则表达式)