1.我们先在浏览器上打开有趣图片网网址:https://www.youqutu.com/mingxing/dalustar
如图所示:
2.我们要下载的是最左侧的图片,我们就需要在网页中找到他们存放的位置,F12查看网页源代码
如图所示:我们要爬取的图片存放在img中,我们知道了图片的位置,那么我们就需要将图片路径解析出来
3.这里呢小编使用的是正则解析。解析出图片路径,我们就要进行保存了。
4.直接上代码:
import requests
import re
import os
if not os.path.exists('./qiutuLibs'):
os.mkdir('./qiutuLibs')
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36'
}
url='https://www.youqutu.com/mingxing/dalustar/list_%s.html'
for i in range(0,20):
new_url=format(url%i)
page_text=requests.get(url=new_url,headers=headers).text
# print(page_text)
ex=''
img_src_list=re.findall(ex,page_text,re.S)
print(img_src_list)
for src in img_src_list:
img_data=requests.get(url=src,headers=headers).content
img_name=src.split('/')[-1]
imgPath='./qiutuLibs/'+img_name
with open(imgPath,'wb') as fp:
fp.write(img_data)
print('下载成功')