Java避免转义+去除html标签

目标是将数据库中存贮的一个字符串加工处理,让后放到xml文件中

1、去除html标签

2、依旧会存在特殊字符影响xml解析,所以加入CDATA标签,避免转义



import org.apache.commons.lang.StringEscapeUtils;
import org.apache.commons.lang.StringUtils;


public class ContentUtil {
    /**
     * Regular expression
     */
    public static final String replaceRegularExpression = "<[.[^<]]*>";

    public static String replaceContent(String source) {
        if (StringUtils.isBlank(source)) {
            return source;
        }
        source = source.replaceAll(replaceRegularExpression, "");
        source = source.replaceAll(" ", "");
        source = StringEscapeUtils.escapeJava("" ;
        return source;

    }

    public static void main(String[] args) {
        String o = "

数据脱敏数据脱敏213131231231dvcxvxx rdc 1231212322<script>aler" + "t(1)</script>qwer

" + "hjdsjjfsdjkfkjdskf. 

qe

hhh" + "

\"42018af"

"; String s; s = replaceContent(o); System.out.println(s); } }

运行结果

这个字符串就可以完美的放入xml中了,类似如下


    
        李刚
        疯狂XML讲义
        电子工业出版社
    
    
        Developer
        XML格式化工具
        
            
        
    

你可能感兴趣的:(java,xml)