网页爬虫中文乱码问题Python

之前在做爬虫测试时一直出现下图中的中文乱码问题:

网页爬虫中文乱码问题Python_第1张图片

试了一些方法更改setting设置之类的都不管用。

网页爬虫中文乱码问题Python_第2张图片网页爬虫中文乱码问题Python_第3张图片

然后看了一篇文章解决了我这种问题,这里做个记录:

首先进入网页打开f12,选择Console:

 然后输入document.charset可以查看网页的编码格式:

网页爬虫中文乱码问题Python_第4张图片

 然后在代码中将编码方式设置成和他一样的就行了:

response = requests.get(url, headers=headers)
response.encoding = 'utf-8'  # 加上这一句
print(response.text)

尾页:

这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字数的这是来凑字

你可能感兴趣的:(Python,python)