去除HTML标签

 /**
	 * 去除str中的HTML标签
	 * 
	 * @param str
	 * @return
	 */
	public static String formatHtml(String str) {
		if (str == null) {
			return "";
		}
		str = str.toLowerCase();
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("&#[^>]*;", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll(" ", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("(javascript|jscript|vbscript|vbs):", "");
		str = str.replaceAll("on(mouse|exit|error|click|key)", "");
		str = str.replaceAll("<\\?xml[^>]*>", "");
		str = str.replaceAll("<\\?[a-z]+:[^>]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("]*>", "");
		str = str.replaceAll("|>)", "");
		return str;
	}

 

你可能感兴趣的:(java,去除HTML标签)