Pytrch爬虫实战学习笔记_5 爬取某应图片壁纸

1 分析页面

1.1 分析网址

https://bing.ioliu.cn/?p=1

1.2 元素寻找页面

 Pytrch爬虫实战学习笔记_5 爬取某应图片壁纸_第1张图片

 2 代码编写

import urllib3
import re
import os

http = urllib3.PoolManager()  # 创建连接池管理对象
# 定义火狐浏览器请求头信息
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:77.0) Gecko/20100101 Firefox/77.0'}

# 通过网络请求,获得该页面的信息
def send_request(url,headers):
    response = http.request('GET',url,headers=headers)
    if response.status == 200:
        html_str = response.data.decode('utf-8')
        return  html_str

# 解析地址并下载壁纸
def download_pictures(html_str):
    # 提取壁纸名称
    pic_names = re.findall('

(.*?)

',html_str) print("未处理的壁纸名称:",pic_names) # 提取壁纸的下载地址 pic_urls = re.findall('

3 效果展示

 

你可能感兴趣的:(Python爬虫实战笔记,pytorch,python,opencv,数据挖掘)