Python爬取彼岸图4k壁纸,想要什么类型的壁纸就输入什么壁纸,太方便了。

你桌面的壁纸还是用的默认壁纸么?太low了,今天教你用python爬取彼岸图网的4k壁纸,想要什么类型的壁纸就爬什么壁纸,快点来跟我一起试试吧!

这个壁纸怎么样?喜欢吗?你值得拥有。。。

代码操作一下

工具使用

开发环境
python3.6
Windows10
开发工具
pycharm
工具包
lxml,os,tkinter

思路解析

1.定义可视化窗口,并设置窗口和主题大小布局
2.定义触发事件1,调用main函数

3.构造起始地址,获取响应,解析数据,提取图片的url地址
start_url = f’http://pic.netbian.com/4k{image_type}/'
4.循环遍历每一个图片的url地址,再获取响应,解析数据,提取标题和地址
5.对img_url发送请求得到img_content,最后保存数据 6.构造翻页的url地址 next_url = f’http://pic.netbian.com/4k{image_type}/index_{i}.html’ 7.接下来和第一页的操作一样 第一页和其他页的请求地址不一样,我采用了第一页和其他页分开写 

Python爬取彼岸图4k壁纸,想要什么类型的壁纸就输入什么壁纸,太方便了。_第1张图片

要将输入的汉字转换为拼音

p = Pinyin()     # user_name为输入的汉字
image_type = p.get_pinyin(user_name).replace('-', '')

得到页面所有图片的url地址

# 请求获取响应
response = session.get(start_url, headers=headers).content.decode('gbk')  # 右键检查 head/meta/@charset 为编码格式

# 解析数据
html_str = etree.HTML(response)
img_info_urls = html_str.xpath('//ul[@class="clearfix"]/li/a/@href')

循环遍历每个图片的url地址,发送请求拿回图片的地址和标题

# 循环遍历,构造img_info_url
        for img_info_url in img_info_urls:
        	# img_info_url需要拼接
            img_info_url = 'http://pic.netbian.com' + img_info_url


            # 对img_info_url发送请求,解析得到img_url img_name
            response = session.get(img_info_url, headers=headers).content.decode('gbk')

            html_str = etree.HTML(response)
            img_url = html_str.xpath('//a[@id="img"]/img/@src')[0]

你可能感兴趣的:(Python,python,html,js,java,epoll)