java去除字符串中的html标签的方法

java去除字符串中的html标签的方法

java代码:

 String htmlStr="<p>念安p>
<p>你好你是p>
<p>加卡是大姐p>";


String  str  = htmlStr.replaceAll("?[^>]+>", ""); //剔出<html>的标签
System.out.println(str);

输出的结果是: 念安 你好你是 加卡是大姐

另外还可以去除回车符、换行符、制表符:

 txtcontent = txtcontent.replaceAll("\\s*|\t|\r|\n", "");//去除字符串中的空格,回车,换行符,制表符

你可能感兴趣的:(java笔记)