str(b, encoding = "utf-8")
str(b, encoding = "gbk")
encoding中写的是原来byte变量的编码 什么类型的编码的字节就要转换成什么类型的编码的字符串
通过
import chardet
ret = chardet.detect(变量)
可以查看原有变量的编码类型enncoding
或者通过decode解码,但是可能会出错。推荐如上
string=b.decode() # 第一参数默认utf8,第二参数默认strict
print(string)
string=b.decode('utf-8','ignore') # 忽略非法字符,用strict会抛出异常
print(string)
string=b.decode('utf-8','replace') # 用?取代非法字符
print(string)
b=bytes(str1, encoding='utf-8')
print(b)
b=str1.encode('utf-8')
print(b)
str没有decode方法,如果调用str.decode会报错
写爬虫时候,返回的response里中文乱码,根据原页面的
来修改编码为
response.encoding = 'gb2312'