Python零基础之爬取瀑布页百度图片(正则表达式,爬虫,反爬,延时,异常处理)

通过正则表达式爬取瀑布页百度图片

  • 思路:
  • 需要注意的地方:

思路:

  1. 根据输入的关键字,获取想要爬取的百度图片页的url地址
  2. 为了方便抓取,把瀑布页的展示模式改为翻页式
  3. 寻找翻页url的规律,获取需要抓取的url地址
  4. 分析url和html源码,通过正则表达式获取原始图片的url地址
  5. 通过正则表达式处理将来需要保存的图片名称
  6. 获取图片数据,并保存为指定名称
# !/usr/bin/python
# Filename: 通过正则表达式爬取瀑布页百度图片.py
# Data    : 2020/07/23
# Author  : --king--
# ctrl+alt+L自动加空格格式化


import requests
import re
import urllib.parse
import time

你可能感兴趣的:(Python零基础,PYTHON爬虫,python,正则表达式)