爬虫编码问题

爬中文网站,取出来的的文字打印出来是这样的乱码:
åªæè¹æåç»å¯æ å±å¹æºç ä¼å¤ä¸å©ä¹ä¸ã

解决方法,指定response的编码:

 r = requests.get(url, headers=headers)
 r.encoding = 'utf-8

你可能感兴趣的:(爬虫编码问题)