import re
from urllib import request,error
url=”https://www.csdn.net/”
data=request.urlopen(url).read().decode(“Utf-8”)
pat=’src=”(.*?.jpg)”’
allbook=re.compile(pat).findall(data)
for i in range(0,len(allbook)):
# try增强爬虫的稳定输出
try:
# 指定文件保存路径以及保存方式
path="C:/Users/ASUS/Desktop/markdown/img/csdnimg"+str(i)+".jpg"
abc="https:"+allbook[i]
#将jpg地址远程数据下载到本地
request.urlretrieve(abc,filename=path)
print("爬取成功")
# 将错误信息临时存给e
except error.URLError as e:
if hasattr(e,"code"): #判断是否有异常状态编码
print(e.code) #输出异常状态编码
if hasattr(e,"reason"): # 判断是否有异常原因
print(e.reason) #输出异常原因