2. 下载
国内下载地址:https://chrome.zzzmh.cn/info?token=hgimnogjllphhhkhlmebbmlgjoejdpjl
3. 将插件添加至谷歌浏览器
4.使用
这里以 www.baidu.com 为例
拓展:
a. 获取批量数据
b. 获取链接
c.获取文本
XPath Helper是一款专用于chrome内核浏览器的实用型爬虫网页解析工具(免费)。
当然还可对查询出的xpath进行编辑,正确编辑的结果将会显示在旁边的结果框,并在网页中高亮显示
更便于获取网页数据xpath,从而进行网络数据批量爬取
1.点击跳转至插件下载地址
2.进入并点击 ‘推荐下载’ 即可下载出压缩包,打开文件下载位置为一个zip文件
1.使用谷歌浏览器,打开设置(Settings)
2.点击扩展(Extensions)
3.打开 开发者模式(Developer mode)
4.将名为 ’hgimnogjllphhhkhlmebbmlgjoejdpjl_2.0.2_chrome.zzzmh.cn.crx‘ 的文件拖拽复制到chrome浏览器
5.点击弹窗中 ‘Add extension’ (添加扩展) 按钮
到此已将 Xpath Helper 插件已添加至谷歌浏览器
1.将 Xpath Helper 钉( pin ) 在主页上, 便于后期插件的使用
这里以 www.baidu.com 页面热搜为例
4.在弹出的 开发者工具栏 复制 Xpath (Copy Xpath) , 并点击上方 xpath helper 插件
5.点击插件后, 将刚复制的 xpath 粘贴至查询框
xpath正确,则结果框中显示网页中相应元素,且网页中相应数据高亮显示
//*[@id="hotsearch-content-wrapper"]/li[1]/a/span[2]
a.批量获取数据
//*[@id="hotsearch-content-wrapper"]/li/a/span[2]
b. 获取链接
//*[@id="hotsearch-content-wrapper"]/li/a/@href
c. 获取文本
//*[@id="hotsearch-content-wrapper"]/li/a/span[2]/text()