关于python3里gbk编码的问题解决

在python3有关字符串的处理当中,经常会遇到

'gbk' codec can't encode character '\xa0'这个问题,原因是在str里面存在着不能正确编码的字符。

通过以下方法即可解决。

import requests
from bs4 import BeautifulSoup
url = "http://jecvay.com/2015/03/learning-compilers-1.html"
url = url.encode('gbk','ignore').decode('utf-8')
response = requests.get(url)
print(response)
soup = BeautifulSoup(response.text)


print(soup.body.text)

你可能感兴趣的:(python)