嗨喽,大家好呀~这里是爱看美女的茜茜呐
Python 3.8 解释器
Pycharm 编辑器
第一次请求: 请求 壁纸目录页面 链接, 获取 壁纸详情页url 数据
发送请求: 壁纸目录页面
获取数据: 整个网页数据内容
解析数据: 提取具体数据内容 -> 壁纸详情页url
第二次请求: 请求 壁纸详情页url, 获取 图片url 数据
发送请求: 壁纸详情页url
获取数据: 整个网页数据内容
解析数据: 提取具体数据内容 -> 图片url
第三次请求: 请求 图片url, 获取图片二进制数据
素材、视频教程、完整代码、插件安装教程我都准备好了,直接在文末名片自取就可
# 导入数据请求模块
import requests
# 导入正则
import re
模拟浏览器: 字典数据类型 <完整键值对形式>
headers = {
# User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.67
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'
}
多页采集
for page in range(1, 11):
if page == 1:
url = 'http://****/meinv/index.htm'
else:
请求链接
url = f'http://****/meinv/index_{page}.htm'
发送请求
response = requests.get(url=url, headers=headers)
转码 * 不要一上来就是 utf-8
response.encoding = 'gbk'
获取数据
html_data = response.text
解析数据, 提取链接地址 \d+ 匹配多个数字
img_id_list = re.findall(', html_data)
for循环遍历
for img_id in img_id_list:
# 构建详情页url
link = f'http:// *****desk/{img_id}.htm'
# 发送请求, 请求详情页url
response_1 = requests.get(url=link, headers=headers)
# 转码
response_1.encoding = 'gbk'
# 获取数据
link_data = response_1.text
# 解析数据
img_url, title = re.findall(', link_data)[0]
# 获取图片数据内容
img_content = requests.get(url=img_url, headers=headers).content
with open('img\\' + title + '.jpg', mode='wb') as f:
写入数据
f.write(img_content)
print(img_url, title)
import os
import ctypes
files = os.listdir('img\\')
for file in files:
path = r'D:\自游\彼岸壁纸\img\{file}'.format(file=file)
ctypes.windll.user32.SystemParametersInfoW(20, 0, path, 3)
print(file)
感谢你观看我的文章呐~本次航班到这里就结束啦
希望本篇文章有对你带来帮助 ,有学习到一点知识~
躲起来的星星也在努力发光,你也要努力加油(让我们一起努力叭)。
最后,宣传一下呀~更多源码、资料、素材、解答、交流皆点击下方名片获取呀