jsoup使用笔记

<dependency>
	<groupId>org.jsoup</groupId>
	<artifactId>jsoup</artifactId>
	<version>1.7.3</version>
</dependency>





2014/08/28
今天遇到这种形式,
<div class="ba_info"></div>
<div class="ba_info ba_info2"></div>

这里如果使用
Elements eles=Jsoup.parse(content).select("div[class=ba_info]");
则只能获取第一个,如果写成div[class=ba_info ba_info2],那就只能获取第二个。

目前知道有如下几种方法:
	Elements as=Jsoup.parse(content).select("div[class^=ba_info]");
//  ^= 表示从ba_info开始的
		
		Elements as2=Jsoup.parse(content).getElementsByClass("ba_info");
		
		Elements as3=Jsoup.parse(content).select("div.ba_info");
//div.ba_info 估计和上面的getElementsByClass差不多一个意思。

你可能感兴趣的:(java,爬虫,JSoup)