2018-02-28

webscraper1

1.微信公众号爬取?

只能抓取标题,日期,但阅读量和点赞无法抓取。
若抓取文章内容,可以抓取纯文本(格式抓不了),图片和内容无法同时抓取。

2.echarts图标导出csv.的插件推荐?

无解答。

webscraper2

1.Mac安装Chrome Webscraper后,看不到创建sipmap的工具界面?

把默认的右侧工具界面设置为下部工具界面。


2018-02-28_第1张图片
设置区域
2.使用Webscraper抓取的数据乱序且有重复怎么办?

教程后期有相关的学习内容及解决办法(重建数据库:Apache CouchDB)

3.某父元素的子元素抓取,结果出现错位?

抓取结果出现错位的情况为子元素平行结构的不正当使用。
例如:
a.未设置相应的父元素;


2018-02-28_第2张图片
无父元素!!!

b.某平行元素只负责功能作用,能够不执行抓取动作,但却为其设置了子元素。(比如解决鼠标滑动加载更多与点击鼠标加载更多相叠加时的爬取作业,滑动鼠标加载更多作为一个平行元素,只需达成鼠标自动滑动的准备动作,无需执行爬取动作——Element Scroll down与Element click)。关键点:没有子元素的父元素抓不出数据。

4.datapreview显示数据,但是抓不出来且显示No data scraped yet?

a.如果是网络问题(网络信号不好??等等……),取消,重新执行抓取操作。
b.修改delay(有时候时间设置太短不仅会影响数据抓取顺利进行,也会导致目标数据的缺失)。

你可能感兴趣的:(2018-02-28)