【Python爬虫】彼岸桌面 1080P 壁纸爬虫

【Python爬虫】彼岸桌面 1080P 壁纸爬虫

以下代码可以爬取彼岸桌面几乎全部 1080P 壁纸共两万张左右,为了减小网站的压力,我设置了 time.sleep() 。下载后的壁纸会存放在 D:\bizhi 目录下,鉴于前几年的壁纸内容质量低,建议把代码中6146改成20000左右的数字。

from requests_html import HTMLSession
import re
import time
os.mkdir('D:\\bizhi')
session = HTMLSession()

for i in range(6146,22654):
    time.sleep(1)
    try:
        url001 = 'http://www.netbian.com/desk/'
        url002 = '-1920x1080.htm'
        url = url001 + str(i) +url002
        r = session.get(url)
        imgs = re.findall('http://img.*?jpg',r.text)
        pic_url = imgs[2]
        pic = session.get(pic_url)
        open('D:\\bizhi\\'+str(i)+'.jpg','wb').write(pic.content)
        print(i)
    except:
        print('Error')

你可能感兴趣的:(Python爬虫系列,python)