android studio 安卓7.0爬虫 学习记录 3

3 获取文章标题清单

3 1 查看页面元素

参考百度经验safari如何查看网页源码对浏览器进行设置。


android studio 安卓7.0爬虫 学习记录 3_第1张图片
设置完后可以看到每篇文章的位置。

3 2 在页面中选取需要的元素

android studio 安卓7.0爬虫 学习记录 3_第2张图片
参考jsoup帮助,按类进行选择


根据网页源码整理选取思路

选取的思路是先找到 class 为 excerpt 的 article ,然后再找 header,然后再找 h2 ,然后再找 a 。


android studio 安卓7.0爬虫 学习记录 3_第3张图片
可以获取到列表,但结果需要优化


android studio 安卓7.0爬虫 学习记录 3_第4张图片
参考进行改进
android studio 安卓7.0爬虫 学习记录 3_第5张图片
改进后结果
android studio 安卓7.0爬虫 学习记录 3_第6张图片
改进后的选择语句

你可能感兴趣的:(android studio 安卓7.0爬虫 学习记录 3)