java 除去HTML元素

   Pattern p = Pattern.compile("<c[w|r|g|y]>.*</c[w|r|g|y]>",Pattern.DOTALL);  
Matcher m = p.matcher("<cw>白色字体</cw><cr>红色字体</cr>");  
String s = "";
while(m.find()){  
s = m.group();   

}      
//后面的?表示非贪婪匹配
s = s.replaceAll("<.*?>", "");
System.out.println(s);

 

你可能感兴趣的:(java,html,C++,c,C#)