目标效果:
爬取页面:摄图网(烫金中国风)
代码:
# -*- codeing =utf-8 -*-
#################引入模块#################
from bs4 import BeautifulSoup # 网页解析,获取数据
import requests
#################定义方法#################
def main():
url = "http://699pic.com/zhuanti/tangjinzhongguofeng.html"
res = requests.get(url) # 发送请求获取网站的返回值(html)
soup = BeautifulSoup(res.text, 'html.parser') # 返回解析内容
divs = soup.find_all('img', class_='lazy') # 寻找目标标签div class=il_img
listImg = [] # 定义列表存放图片链接
for div in divs:
img = div["data-original"] # 获取“data-original”的属性值
listImg.append(img)
n = 0
for x in listImg: # 循环发送请求,访问每张图片
res = requests.get("http:" + x)
n += 1
print("正在下载第%d张图片" % (n))
with open("index" + str(n) + ".jpg", "wb+") as file: # 写入二进制文件
file.write(res.content) # 返回回来的内容,为二进制
print("第%d张图片下载完成" % (n))
#################主程序#################
if __name__ == "__main__":
main()
print("爬取完毕!")