Jsoup中getElementsByClass中className有空格处理

今天在做网络爬虫的作业是,用jsoup解析html网页时要获得一个class为ep-time-soure cDGray的div的内容。发现doc.getElementsByClass("ep-time-soure cDGray")取值为空。很郁闷,结果查了一圈资料。知道了有空格是表示这个div继承了两个class。

有两种解决方法。1.如果里面有一个class在网页中是唯一的,那么直接doc.getElementsByClass("ep-time-soure")。因为我发现cDGray好像表示的是字体颜色。2.嵌套调用doc.select(".ep-time-soure").select(".cDGray")。我使用的是前面的一个方法,后面的方法是搜索得到的。

你可能感兴趣的:(java,web)