关于正则表达式匹配字符串判断语种的问题小结

	今天遇到了这么一个坑的问题,设计的多语言功能,一共十五种语言,都可以正常显示出来,除了阿拉伯语,韩语,印地语!!!
	这就是一个坑啊,找遍方法,最终想到了用正则表达式判断unicode来判断,不由得给自己点了个赞,然后就懵逼了,死活判断不进!!!
	代码如下:
if (content.matches("[\\u0600-\\u06ff|\\u0750-\\u077f]+")) {
			//单独判断是否是阿拉伯语
			System.out.println("判断到阿拉伯文语");
		}

最终,可能自己对正则表达式理解的不够透彻(这方面需要加强),最终找到了原因,修改后代码如下:

if (content.matches("[\\u0600-\\u06ff|\\u0750-\\u077f].*")) {
			//单独判断是否是阿拉伯语
			System.out.println("判断到阿拉伯文语");
		}

看出什么问题了么?对,就是结尾处的".*"与“+”的区别,具体区别后面在补充,先将代码完成。

你可能感兴趣的:(java底层小功能,正则表达式)