java正则小例子:获取两个字符串中间的内容

java正则小例子:获取两个字符串中间的内容

import java.util.regex.Matcher;
import java.util.regex.Pattern;

//Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过 Pattern.complie(String regex) 简单工厂方法创建一个正则表达式。 
//Pattern.matcher(String regex,CharSequence input)是一个静态方法,用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串;
//Pattern.matcher(CharSequence input)返回一个Matcher对象. 
//Matcher类的构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例. 
//Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持. 

public static void main(String[] args) throws Exception { 

		//===========test1===============
		Pattern p=Pattern.compile("\\d+"); //匹配数字
		Matcher m=p.matcher("22bb23"); 
		while(true){
			if(m.find()){
				System.out.println(m.group());
			}else{
				break;
			}
		}//结果22、33
		//===========test2===============	
		java.util.regex.Pattern pattern = java.util.regex.Pattern.compile("发证日期[<>:=:、\\s+]?(\\d{4}[-年]?\\d{1,2}[-月]?\\d{1,2}日?)"); //匹配年月日
		java.util.regex.Matcher m3 = pattern.matcher("市兴庆区金汇博酒店用品商行,发证日期=2040-06-01,有效期止=2041-05-31,税务机关");
		 if(m3.find()){
			  String sortTime=m3.group(1);
			  System.out.println(sortTime);
		  }
		 
		 //===========test3===============
		//匹配 立案日期到逗号之间的内容
		Pattern pattern2 = Pattern.compile("立案日期=(.*?),");
		Matcher m2 = pattern2.matcher("被执行人失信情形=违反财产报告制度, 性别=, 姓名=罗波, 立案日期=2018-08-31, 执行案号=(2018)桂0204执恢282号, 发布时间=2018-08-31, 证件类型=");
		if (m2.find()) {
			System.out.println(m2.group(1));
		}


		//替换掉 ~、[、]、(、)、"
		System.out.println("[2015]0泉~仲(字)\"1498\"号".replaceAll("[~\\[\\]\\(\\)\"]", ""));	//结果:20150泉仲字1498号
		//替换掉 %、&、~、[、]、(、)、"、任意空格
		System.out.println("[2015]0&泉~仲(字)\"1498\" 号%".replaceAll("[%&~\\[\\]\\(\\)\"\\s]", ""));//结果:20150泉仲字1498号

		//获取 某个字符
		Pattern gte = Pattern.compile("大于等于(?.+?(?=%))");
		Matcher matcher = gte.matcher("大于等于3%");
		if (matcher.find()) {
			String n = matcher.group("a");
			System.out.println(n);//3
		}
}

学习笔记:

表达次数的符号
* 0次或者多次
+ 1次或者多次
? 0次或者1次
{n} 恰好n次
{n,m} 从n次到m次

x 字符 x 
\\ 反斜线字符 
\0n 八进制值的字符0n (0 <= n <= 7) 
\0nn 八进制值的字符 0nn (0 <= n <= 7) 
\0mnn 八进制值的字符0mnn 0mnn (0 <= m <= 3, 0 <= n <= 7) 
\xhh 十六进制值的字符0xhh 
\uhhhh 十六进制值的字符0xhhhh 
\t 制表符('\u0009') 
\n 换行符 ('\u000A') 
\r 回车符 ('\u000D') 
\f 换页符 ('\u000C') 
\a 响铃符 ('\u0007') 
\e 转义符 ('\u001B') 
\cx T对应于x的控制字符 x 
  
字符类 
[abc] a, b, or c (简单类) 
[^abc] 除了a、b或c之外的任意 字符(求反) 
[a-zA-Z] a到z或A到Z ,包含(范围) 
[a-z-[bc]] a到z,除了b和c : [ad-z](减去) 
[a-z-[m-p]] a到z,除了m到 p: [a-lq-z] 
[a-z-[^def]] d, e, 或 f 

备注:
方括号的正则表达式“t[aeio]n”只匹配“tan”、“Ten”、“tin”和“ton”,只能匹配单个字符。
圆括号,因为方括号只允许匹配单个字符;故匹配多个字符时使用圆括号“()”。比如使用“t(a|e|i|o|oo)n”正则表达式,就必须用圆括号。
预定义的字符类 
. 任意字符(也许能与行终止符匹配,也许不能) 备注:句点符号代表任意一个字符。比如:表达式就是“t.n”,它匹配“tan”、“ten”、“tin”和“ton”,还匹配“t#n”、“tpn”甚至“t n”。
\d 数字: [0-9] 
\D 非数字: [^0-9] 
\s 空格符: [ \t\n\x0B\f\r] 
\S 非空格符: [^\s] 
\w 单词字符: [a-zA-Z_0-9] 
\W 非单词字符: [^\w]

匹配掉Unicode

import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.apache.commons.lang3.StringUtils;

public class Test {
	public static void main(String[] args) {
		String str="具备\u0011真成 \u0010从企\u0017业性质来看";
		System.out.println(replaceWrongUnicode(str, ""));
	}
	public static  String replaceWrongUnicode(String source, String replace) {
        if (StringUtils.isBlank(source)) {
            return source;
        }
        if (StringUtils.isBlank(replace)) {
            replace = "";
        }
        Pattern CRLF = Pattern.compile("([\\u0000-\\u0019]|[\\u001A-\\u001F]|[\\u001a-\\u001f]|[\\u007f-\\u009f]|\\u00ad|[\\u0483-\\u0489]|[\\u0559-\\u055a]|\\u058a|[\\u0591-\\u05bd]|\\u05bf|[\\u05c1-\\u05c2]|[\\u05c4-\\u05c7]|[\\u0606-\\u060a]|[\\u063b-\\u063f]|\\u0674|[\\u06e5-\\u06e6]|\\u070f|[\\u076e-\\u077f]|\\u0a51|\\u0a75|\\u0b44|[\\u0b62-\\u0b63]|[\\u0c62-\\u0c63]|[\\u0ce2-\\u0ce3]|[\\u0d62-\\u0d63]|\\u135f|[\\u200b-\\u200f]|[\\u2028-\\u202e]|\\u2044|\\u2071|[\\uf701-\\uf70e]|[\\uf710-\\uf71a]|\\ufb1e|[\\ufc5e-\\ufc62]|\\ufeff|\\ufffc)");
        Matcher m = CRLF.matcher(source);
        if (m.find()) {
            return m.replaceAll(replace);
        }
        return source;
    }
}

replaceAll

name.replaceAll("[×�,,!@#$%^&*()\\[\\]\\(\\)\\~\"-|——=+/\\\\d\\s\\w]", "");

你可能感兴趣的:(工作记录)