采集字段:
卖家、卖家链接、联系方式链接、联系人、电话、移动电话、传真、地址、公司主页
功能点目录 :
如何对采集字段进行配置
如何采集列表+详情页类型网页
如何采集需要登录才能查看的网页
采集结果预览:
下面我们来详细介绍一下如何免费采集1688批发网的卖家联系方式,我们以“围巾卖家”为例,具体步骤如下:
步骤一:下载安装后羿采集器,并注册登录
1、打开后羿采集器 官网 ,下载并安装最新版的后羿采集器
【温馨提示】 您可以直接使用此款爬虫软件,不需要进行注册,但是匿名账户下的任务在切换到注册用户时会丢失,因此建议您注册后使用。
后羿采集器为神箭手旗下产品,神箭手用户可直接登录。
步骤二:新建采集任务
1、复制 1688围巾卖家 的网页地址(需要搜索结果页的网址,而不是首页的网址)
2、新建智能模式采集任务
您可以在软件上直接新建采集任务,也可以通过导入规则来创建任务。
步骤三:配置采集规则
1、使用预登录功能登录淘宝
输入网址后,我们进入淘宝宝贝的详情页,此时页面上出现的登录界面我们可以点击关闭,然后使用预登录功能登录淘宝。
在跳转出的预登录界面中,我们输入账户密码点击登录,然后点击登录完成跳转回编辑任务界面。
2、设置提取数据字段
在智能模式下,我们输入网址后软件即可自动识别出页面上的数据并生成采集结果,每一类数据对应一个采集字段,我们可以右击字段进行相关设置,包括修改字段名称、增减字段、处理数据等。
在此列表页上,我们只需要采集卖家及卖家链接,字段设置效果如下:
3、使用深入采集功能提取详情页数据
我们需要采集卖家的具体联系方式,这里需要用到两次深入采集,我们点击卖家链接,然后使用第一次“深入采集”功能,跳转到详情页进行采集。
进入到详情页后,我们设置联系方式字段及联系方式链接,字段设置效果如下:
此时完成了第一次深入采集,我们选中联系方式链接使用第二次深入采集功能。
在跳转出的卖家联系方式详情页上,我们可以看到具体的数据,我们点击添加字段添加需要的数据,字段设置效果如下:
步骤四:设置并启动采集任务
1、启动采集任务
点击“开始采集”按钮,可在弹出的启动设置页面中进行一些高级设置,包括“开启定时、开启防屏蔽、开启自动导出、开启图片下载、开启加速引擎”功能,输入框内为默认设置,如果需要设置具体的功能,勾选相应功能跳转界面去设置,本次采集任务没有使用到这些功能,直接点击“启动”运行爬虫工具。
点此 深入了解什么是定时采集。
点此 深入了解什么是自动入库。
点此 深入了解如何下载图片。
【温馨提示】 免费版本可以使用非周期性定时采集功能,下载图片功能是免费的。个人专业版及以上版本可以使用高级定时功能和自动入库功能。
2、运行任务提取数据
任务启动之后便开始自动采集数据,我们从界面上可以直观的看到程序运行过程和采集结果,采集结束之后会有提醒。
步骤五:导出并查看数据
数据采集完成后,我们可以查看和导出数据,后羿采集器支持多种导出方式(手动导出到本地、手动导出到数据库、自动发布到数据库、自动发布到网站)和导出文件的格式(EXCEL、CSV、HTML和TXT),同时还支持导出具体条数,也可以在数据中选择想导出的条数,然后点击“确认导出”。
点此 深入了解如何查看和清空采集数据。
点此 深入了解如何导出采集结果。
【温馨提示】: 所有手动导出功能都是免费的。个人专业版及以上版本可以使用发布到网站功能。
再为您推荐几个相关的采集教程:
如何免费采集淘宝商品评论数据
如何免费采集苏宁商品评论数据
如何免费采集阿里巴巴批发网商品数据
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31563416/viewspace-2287169/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/31563416/viewspace-2287169/