学习Python爬虫(五):爬取图片

直到现在我们都是在和文本形式的页面打交道,现在是时候来尝试点新事物了——今天我们尝试爬取图片,当然既然是爬取那就一定遵循Python爬虫的基本法,前面讲过的的知识对图片的爬取同样适用:让我们开始吧!


网络图片的URL格式

如果一个URL链接是以.jpg结尾,那它就是一个图片链接

http://www.example.com/picture.jpg

例如(国家地理的某张图片)

http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg

在知道了图片的url链接后,我们还要给出把图片保存到本地的位置路径

path = '/Users/macbookpro/Desktop'  #这里path变量用来保存目标路径,名字可以随便取,最好利于阅读

保存网络图片到本地

知识点:
1)使用Requests库爬取网络图片
2)处理返回Responce对象,在该对象身上调用方法
3)文件处理(hint:图片是二进制格式,r.content表示返回信息的二进制格式)

开始吧:

学习Python爬虫(五):爬取图片_第1张图片

学习Python爬虫(五):爬取图片_第2张图片

让我们把代码写得健壮一点:

学习Python爬虫(五):爬取图片_第3张图片

学习Python爬虫(五):爬取图片_第4张图片

学习Python爬虫(五):爬取图片_第5张图片

学习Python爬虫(五):爬取图片_第6张图片

是不是很清晰、很有成就感?还等什么,赶紧上机试一试吧!

写在最后:通过文件读写,我们把二进制存储格式的网络图片保存到了本地——类似的,我们还可以用来爬取网络上的音乐、视频等

你可能感兴趣的:(Python,语言)