小O网兜0231新版 -- 用户入门指南

本文介绍小O网兜入门功能,通过本文用户能够掌握数据采集的基本操作,使用软件提供的模板任务采集指定页面的数据。



基本概念

  • 任务文件:新建任务文件,扩展名为 xop,任务的配置、采集数据等信息保存在该文件中,妥善保存文件。
  • 采集规则:针对采集网页设置的采集规则,由一组采集动作组成,可自动循环执行。
  • 采集动作:采集规则下的动作,提供多种类型的动作,包括打开网页、点击、翻页、采集等动作。
  • 数据表:采集数据保存在数据表中,用户根据采集数据结构设置表和字段。


功能简介

启动软件
启动软件后,注册并登陆后,点击左上角开始。

小O网兜0231新版 -- 用户入门指南_第1张图片



 

新建任务


在任务向导界面中,新建或打开任务文件。
也可以直接下载配置好的模板任务文件,选择保存任务文件的路径,点击确定打开任务。
如下载模板中没有你想要的,可以加入QQ群与客服联系由客服配置模板。

点击下载模板文件,内含的任务,打开后可直接运行

小O网兜0231新版 -- 用户入门指南_第2张图片



采集数据


打开任务界面,如下图

小O网兜0231新版 -- 用户入门指南_第3张图片




启动采集


选择目标动作,点击鼠标右键菜单,选择执行即可启动采集。

  • 如下载模板任务,已配置好采集规则,可直接启动采集。
  • 如新建模板任务,则需先配置采集规则。

小O网兜0231新版 -- 用户入门指南_第4张图片


● 执行(单步):仅执行当前选中的动作。
● 执行(循环):从当前选中的动作开始依次执行动作,按配置循环执行。


重置规则


打开页面、翻页动作等个别动作,自身有需执行的记录,如执行完再次执行会提示任务已完成或无记录的提示。如需再次执行,需要重置动作。


●  重置当前动作:在动作上右键菜单,选择重置当前动作,重置当前动作。

小O网兜0231新版 -- 用户入门指南_第5张图片



●  重置所有动作:选择规则节点,点击右键菜单,选择重置所有动作。

小O网兜0231新版 -- 用户入门指南_第6张图片




查看数据


点击【数据表】,打开当前任务的数据表,用户通过该界面可以新建数据表、配置数据表、数据字段、导出采集数据、删除重复数据等操作。

小O网兜0231新版 -- 用户入门指南_第7张图片



导出数据


采集的数据可导出成CSV等文件,同时提供删除重复记录等功能。

小O网兜0231新版 -- 用户入门指南_第8张图片




配置规则


采集规则决定了任务执行的规则,为本软件高级功能。
新建空任务后,配置采集规则,首先在右侧浏览地址栏输入目标网址,打开该页面。
依次配置“数据表”、“新建规则”

小O网兜0231新版 -- 用户入门指南_第9张图片



配置数据表


对照网页内容,依次新建表、修改表名、字段名。

小O网兜0231新版 -- 用户入门指南_第10张图片




配置规则


新建采集规则,并借助右侧的网页树和网页浏览器配置规则及动作参数。
新建规则后,默认会添加打开网页、扫描页面、读取数据、跳转步骤等动作,下图A区
配置动作参数,不同类型动作对应不同参数,用以控制动作执行,下图B区。

小O网兜0231新版 -- 用户入门指南_第11张图片



规则配置详细内容见知识库专题。


 

收藏页面


用户浏览网页,可以将目标网页收藏至收藏夹中,待后续进入软件时打开。
选中网页节点,点击鼠标右键,可打开、删除页面。

小O网兜0231新版 -- 用户入门指南_第12张图片




<本文完>

你可能感兴趣的:(小O网兜,数据挖掘,网络爬虫,爬虫)