python-requests模块

response.text和response.content的区别

  • response.text
    类型:str
    解码类型:requests模块自动根据http头部对响应的编码做出推测,推测返回文本的编码格式,如果使用这种方式接收,如果猜测错误会导致乱码
  • response.content
    类型:bytes
    解码类型:没有指定,我们接收到之后可以按照自己想要的方式进行转换
    例如:以下--test.py
import requests
url = 'http://www.baidu.com'
response = requests.get(url)
response.encoding = 'utf8'
print(response.text)

#第二种方式
url = 'http://www.baidu.com'
response = requests.get(url)
#不传也行,默认就是utf-8
print(response.content.decode('utf-8'))

通过对response.content进行decode,来解决中文乱码

  • response.content.decode() 默认utf-8
  • response.content.decode("gbk")
  • 常见的编码字符集
    1.utf-8
    2.gbk
    3.ascii
    4.iso-8859-1

你可能感兴趣的:(python-requests模块)