Python爬虫

Python爬虫

  • 爬虫简介
    • why
    • 了解网页结构
  • BeautifulSoup解析网页
    • 基础
    • CSS
    • 正则表达
    • 小练习:爬百度百科
  • 更多请求/下载方式
    • 多功能的Requests
    • 下载文件
    • 小练习:下载美图
  • 高级爬虫
    • 让Selenium控制浏览器爬
    • 高效无忧的Scrapy爬虫库

爬虫简介

why

爬虫是在网页上爬取数据,搜集数据。

了解网页结构

网页由代码构成,HTML,构件还有CSS和JavaScript。
一个简单网页是最简单的HTML结构,HTML包括head和body。
Python登录网页

BeautifulSoup解析网页

基础

CSS

正则表达

小练习:爬百度百科

更多请求/下载方式

多功能的Requests

下载文件

小练习:下载美图

高级爬虫

让Selenium控制浏览器爬

高效无忧的Scrapy爬虫库

你可能感兴趣的:(Python)