爬虫的基本流程

发起请求

    1.什么是请求

    2.请求的流程

    3.怎么发起请求

    4. 查看请求的结果

获取响应内容

    1获取文本

    2获取图片、视频

解析内容

    1. 直接处理

    2. Json解析

    3. 正则表达式

    4. 解析库如 Beautifulsoup 、PyQuery 、XPath

保存数据

    1. 文本:纯文本、Json、XML等

    2. 关系型数据库:如MySQL、Oracle、SQL Server等具有结构化表结构形式存储

你可能感兴趣的:(爬虫的基本流程)