Web Scraper爬虫工具(2)——采集1688供应商信息

  • 新建 sitemap
  • 新建对象Element
    • (需要注意是:采集多个内容一定要先添新建Element,再从Element里采集
    • 指定需要采集的数据
  • 点击 Scrape 开始采集
  • 点击 Export data 导出数据

新建 sitemap

  1. 打开开发者工具
  2. 选择 web scraper
  3. 选择 Create Sitemap
    Web Scraper爬虫工具(2)——采集1688供应商信息_第1张图片
  4. 在 Sitemap name 的位置
    • 输入supplier(可随意更改)
  5. 在 Start URL 输入需要采集的数据的网址
  6. 后点击 Create Sitemap
    在这里插入图片描述

新建对象Element

Web Scraper爬虫工具(2)——采集1688供应商信息_第2张图片

选项 释义
Id 选择器的名称
Type 选择器的类型
Seletor 指定需要采集的数据
Multiple 如果需要采集多条数据,就勾选它

选择器使用可查看官方文档:
https://www.webscraper.io/documentation/selectors

采集多条供应商信息

Web Scraper爬虫工具(2)——采集1688供应商信息_第3张图片

  1. 点击add select(id自己命名为supplier_block),选择Element选择器,点击select(选择所有供应商信息选区)
    Web Scraper爬虫工具(2)——采集1688供应商信息_第4张图片
  2. 点击supplier_block,点击add select(id为name),选择Text选择器,点击select(选择供应商名称)
    Web Scraper爬虫工具(2)——采集1688供应商信息_第5张图片
    3.依次add select地址、面积、人数
    Web Scraper爬虫工具(2)——采集1688供应商信息_第6张图片
    右上角点击data preview进行数据预览

点击 Scrape 开始采集

Web Scraper爬虫工具(2)——采集1688供应商信息_第7张图片
点击刷新数据
Web Scraper爬虫工具(2)——采集1688供应商信息_第8张图片
浏览采集的数据
Web Scraper爬虫工具(2)——采集1688供应商信息_第9张图片

点击 Export data 导出数据

Web Scraper爬虫工具(2)——采集1688供应商信息_第10张图片

下一步改进

  • 采集多页数据

你可能感兴趣的:(Web,Scraper,前端,爬虫)