百度图片爬取

from urllib.request import urlopen,urlretrieve
import re
url = "https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%C5%DC%B3%B5&fr=ala&ala=1&alatpl=adress&pos=0&hs=2&xthttps=111111"
html = urlopen(url)
obj = html.read().decode() #得到网页HTML源码
urls = re.findall(r'"objURL":"(.*?)"',obj)#在这一步,获取网页中的objURL部分,也就是真正的图片地址
index = 0
for url in urls:
    if index <=5:#控制下载10张
        try:
            print('Downloading...%d'%(index))
            urlretrieve(url,'pic'+str(index)+'.png') #urlretrieve函数 下载图片
            index += 1
        except Exception: #当由于网络原因或图片服务器出现问题时,捕获异常即可,不使程序退出
            print('Downloading Failed%d'%(index))
        finally:
            print('Downloading Complete')
    else:
        break

你可能感兴趣的:(百度图片爬取)