爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容

尝试快速打印一个页面的列表信息,我尝试用console.log+$x()快速打印结果。

先找到一个合适的测试对象,比如csdn首页的热点:

爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容_第1张图片

按F12进入开发者工具找到这个列表的xpath:

根据我写的xpath找到了5个:

爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容_第2张图片

 尝试把其中一个的标题打印出来:

爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容_第3张图片

副标题打印出来:

爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容_第4张图片

完美打印。

现在我需要快速把5个的标题和副标题都提取出来:

爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容_第5张图片

 写一个循环操作,贴到控制台,按Enter:

拿到了: 

爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容_第6张图片

 点击右键复制object:

爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容_第7张图片

 粘贴到文本文档,成功拿到结果:

爬虫分析必备技能:Chrome浏览器使用$x()快速提取列表内容_第8张图片

 上述的完整代码如下:

var listCount = $x("//div[@class='headswiper'][2]/div[contains(@class, 'headswiper-content')]//div[@class='headswiper-item']").length;
var tmpList = [];
for(var i=0; i

 想快速提取其他页面的列表文字,把xpath路径改一下即可。

觉得不错,点个赞呗!

你可能感兴趣的:(chrome,前端,html,爬虫)