Jsoup使用总结

Jsoup是对网页进行解析的工具:

首先通过网页地址获取网页的数据(String格式),然后就是使用jsoup将进行对结点解析:
//解析html成Document
public static Document getDocument(String html){
Document doc = Jsoup.parse(html);
return doc;
}
//这是三个节点:超链接,图片地址,还有p是段落的标签,我就做了三个,其他可以百度
public class HtmlSelector {
public static String href = “a”;
public static String img = “img[src]”;
public static String p = “p”;
}

//解析Doc,htmlSelector 是HtmlSelector中的参数
public static Elements getElement(Document doc,String htmlSelector ){
Elements links = doc.select(htmlSelector );
return links;
}
//提供获取超链接的模板,其他类似,都是根据attr(arg)方法,对于img标签获取图片地址是attr(src),p标签更简单直接用text()方法就可以获取其中的文字
public static List getData(Document doc){
List list = new ArrayList();
Elements href = getElement(doc,HtmlSelector.href);
for (Element e1:href){
YelloObj ye = new YelloObj();
//只要超链接,在上下页用到
String h = e1.attr(“href”);
String t = e1.text();
//Log.e(“Main”, “获取的文字: “+t);
if (h.endsWith(“.htm”)) {
ye.setYelloHref(h);
ye.setYelloText(t);
list.add(ye);
}
return list;

}

你可能感兴趣的:(Jsoup使用总结)