HTML PARSER 文章截取摘要功能

 

做SNS和BLOG 常常遇见 的截取文章需要

 

 

直接使用String.subString截取 会破坏html标签,导致整个网站的html错乱

使用正则去除HTML又不能显示摘要部分的图片

 

最好的解决方法就是使用开源项目HTML PARSER

 

可以去sourceforge.net上下载HTML PARSER2.0 下不到的可以加我QQ294860

 

public class HTML_PARSER { public static void main(String args[]){ System.out.println( subcontent() ); } public static String subcontent() { try { String html = "<head>fsafs"+"<title>hjgjhgjgk"+"<p"; Parser parser = Parser.createParser(new String(html.getBytes(), "8859_1"), ""); //registerTags(parser); NodeList nodelist = parser .extractAllNodesThatMatch(new NodeFilter() { public boolean accept(Node node) { if (node instanceof CompositeTag) return true; return false; } }); String str = ""; String tmp = ""; for (int i = 0; i < nodelist.size(); i++) { CompositeTag testTag = (CompositeTag) nodelist.elementAt(i); if (testTag.getParent() == null) { tmp = new String(testTag.toHtml().getBytes("8859_1")); str += tmp + "/n"; } } return str; } catch (Exception e) { return ""; } } } 

你可能感兴趣的:(html,exception,String,Blog,Class,SNS)