一个月学通Python(二十八):Python网络数据采集(爬虫)概述(爬虫)

专栏介绍

结合自身经验和内部资料总结的Python教程,每天3-5章,最短1个月就能全方位的完成Python的学习并进行实战开发,学完了定能成为大佬!加油吧!卷起来!

全部文章请访问专栏:《Python全栈教程(0基础)》


文章目录

    • 专栏介绍
    • 什么是爬虫
      • 爬虫的应用领域
      • 爬虫合法性探讨
        • Robots协议
      • 超文本传输协议(HTTP)
        • 相关工具
      • 爬虫的基本工作流程


什么是爬虫

爬虫(crawler)也经常被称为网络蜘蛛(spider),是按照一定的规则自动浏览网站并获取所需信息的机器人程序(自动化脚本代码),被广泛的应用于互联网搜索引擎和数据采集。使用过互联网和浏览器的人都知道,网页中除了供用户阅读的文字信息之外,还包含一

你可能感兴趣的:(Python全栈教程(0基础),python,网络,爬虫)