Python 网页爬取图片

实例:

import re   #导入正则表达式的库
import requests   #导入第三方http库
import os
import shutil
import time

html = requests.get("http://news.qq.com/photo.shtml")  #通过get方法获取腾讯新闻的网页源代码
html.encoding = 'utf-8'   #编码方式utf-8,用于正常显示中文
#print(html.text)   #显示源码

homedir = os.getcwd()   #获取项目当前路径
if os.path.exists(homedir+'\pic'):
    shutil.rmtree(homedir+'\pic')
else:
    os.mkdir(homedir+'\pic')   #创建pic文件夹,用于保存图片

pic_url = re.findall('img src="(.*?)"',html.text,re.S)   #设定正则表达式,爬取图片的url,匹配任意字符/包括换行符re.S
i = 0
for each in pic_url:   #遍历pic_url
    print('now downloading:' + each)
    #pic = requests.get("http://news.qq.com/photo.shtml/"+each) #补充完整的网址,通过get方法获取图片
    pic = requests.get(each)  # 补充完整的网址,通过get方法获取图片
    fp = open('pic\\' + str(i) + '.png','wb')  #在pic文件夹下创建jpg格式的文件
   # fp = open('pic\\', 'wb')  # 在pic文件夹下创建jpg格式的文件
    fp.write(pic.content)  #将图片写入到工程文件夹下的pic文件夹中
    fp.close()
    i += 1



结果:

Python 网页爬取图片_第1张图片



你可能感兴趣的:(PYTHON)