06-数据提取-概念和分类

爬虫中数据的分类:
  • 结构化数据:json,xml等
    json:可以通过键值对获取的数据
    处理方式:json、jsonpath
  • 非结构化数据:HTML,字符串
    没有规律
    处理方式:re、xpath、bs4

你可能感兴趣的:(06-数据提取-概念和分类)