java正则表达式去掉html标签

java正则表达式去掉html标签


java获取到的值中会参杂这html标签,这不是我们想要的,那么我们该如何简便的去掉其中的所有html标签呢?

html标签大都环绕着<> ,那么我们可以通过匹配<>来去掉字符串中所有的html标签:


String.replaceAll("<[^>]*>","");

String.replaceAll(" ","");





你可能感兴趣的:(JAVA,正则表达式)