使用requests下载文件

普通下载

以哔哩哔哩壁纸站为栗子


通过开发者模式找到该图片的url,例如选中图片的链接为https://i0.hdslb.com/bfs/album/1eab364136f7dc024eac1d663bb843c43c996798.jpg

import requests
url='https://i0.hdslb.com/bfs/album/1eab364136f7dc024eac1d663bb843c43c996798.jpg'

r=request.get(url)
f=open('./img/img2.jpg','wb')#'./img'为源文件夹的下一个文件夹,而最后的img.jpg就是最终的文件
f.write(r.content)

使用requests下载文件_第1张图片

这张图片就下载好了,而其他文件例如音频,pdf文件也是同理

有效率的下载

直接使用f.write的话,是先把r.content全部写到内存里,在写到硬盘当中,显然这样既不效率且占用内存,因此另一种更有效率的下载方式是以文件流的形式下载

实现:

  • get()里的stream参数设置为True
  • 使用for...in的形式写文件
r=request.get(url,stream=True)
f=open('./img/img2.jpg','wb')
for a in r.iter_content(chunk_size=32):#iter是iter
	f.write(a)

这样写计算机的实际操作就是每加载一部分,就直接写到f指向的文件里

你可能感兴趣的:(python杂记)