python爬虫--使用requests爬取网页出现中文乱码

问题描述:

很多人在爬虫时可能会遇到乱码问题(如下图所示),博主查了好久,根据各路大神给的方法一一尝试,终于解决!现记录并总结一下。

python爬虫--使用requests爬取网页出现中文乱码_第1张图片


原因分析及解决方案:

1. 网页编码方式为"GBK",所以将其设置为“utf-8”或者调用自带方法
python爬虫--使用requests爬取网页出现中文乱码_第2张图片
python爬虫--使用requests爬取网页出现中文乱码_第3张图片2. 网页编码方式为"utf-8",去掉header中:Accept-Encoding参数

python爬虫--使用requests爬取网页出现中文乱码_第4张图片

你可能感兴趣的:(python,python,乱码)