后羿采集器的使用

后羿采集器的使用

1.下载链接

https://www.houyicaiji.com/ (后羿采集器)

https://www.bazhuayu.com/ (八爪鱼采集器)

2.打开页面

下载登录以后,新建分组,自拟组名即可

![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PPQJm9fZ-1677067733061)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20230222192749344.png)](https://img-blog.csdnimg.cn/10b45fb2f41f4741bf3d88f8fdd1640f.png)

3.采集方式选择

后羿采集器的使用_第1张图片

根据自己的需求来选择,这里我们采用智能模式,智能模式相对简单一点。

4.爬取

顺序如图:

后羿采集器的使用_第2张图片

点击立即创建之后就会自动识别爬取网页,如下图:

后羿采集器的使用_第3张图片

爬取豆瓣网top250的电影信息

后羿采集器的使用_第4张图片

也可以根据自己的需求对数据进行筛选,比如说只需要爬取评分为9.5以上的电影

后羿采集器的使用_第5张图片

后羿采集器的使用_第6张图片

保存采集即可。

你可能感兴趣的:(python数据分析,css,编辑器,pycharm)