以哔哩哔哩壁纸站为栗子
通过开发者模式找到该图片的url,例如选中图片的链接为https://i0.hdslb.com/bfs/album/1eab364136f7dc024eac1d663bb843c43c996798.jpg
import requests
url='https://i0.hdslb.com/bfs/album/1eab364136f7dc024eac1d663bb843c43c996798.jpg'
r=request.get(url)
f=open('./img/img2.jpg','wb')#'./img'为源文件夹的下一个文件夹,而最后的img.jpg就是最终的文件
f.write(r.content)
这张图片就下载好了,而其他文件例如音频,pdf文件也是同理
直接使用f.write
的话,是先把r.content
全部写到内存里,在写到硬盘当中,显然这样既不效率且占用内存,因此另一种更有效率的下载方式是以文件流的形式下载
实现:
get()
里的stream
参数设置为True
for...in
的形式写文件r=request.get(url,stream=True)
f=open('./img/img2.jpg','wb')
for a in r.iter_content(chunk_size=32):#iter是iter
f.write(a)
这样写计算机的实际操作就是每加载一部分,就直接写到f
指向的文件里