【Python爬虫】彼岸桌面 1080P 壁纸爬虫
以下代码可以爬取彼岸桌面几乎全部 1080P 壁纸共两万张左右,为了减小网站的压力,我设置了 time.sleep() 。下载后的壁纸会存放在 D:\bizhi 目录下,鉴于前几年的壁纸内容质量低,建议把代码中6146改成20000左右的数字。
from requests_html import HTMLSession
import re
import time
os.mkdir('D:\\bizhi')
session = HTMLSession()
for i in range(6146,22654):
time.sleep(1)
try:
url001 = 'http://www.netbian.com/desk/'
url002 = '-1920x1080.htm'
url = url001 + str(i) +url002
r = session.get(url)
imgs = re.findall('http://img.*?jpg',r.text)
pic_url = imgs[2]
pic = session.get(pic_url)
open('D:\\bizhi\\'+str(i)+'.jpg','wb').write(pic.content)
print(i)
except:
print('Error')