Python3爬虫获取数据后写入CSV文档遇到中文乱码问题

首次利用python3编写爬虫程序,按部就班的做好所有工作之后,发现写入到CSV文件中的中文为乱码,查找资料之后,需要在打开准备写入的CSV文件时将编码格式更改。

with open('tieba.csv', 'w', encoding = 'UTF-8-sig') as f:
    writer = csv.DictWriter(f, fieldnames=['username', 'content', 'reply_time'])
    writer.writeheader()
    writer.writerows(result_list)

这里的 ‘UTF-8-sig’ 即为写入中文的形式,或者利用记事本进行中转,不过过程较为繁琐罢了。
经检测后,或许使用 ‘GBK’ 编码方式更好一些,实测可用。

网络上还有一种说法是 ‘UTF-8-BOM’ ,经尝试之后,发现报错,并不能解决问题。

报错如下:

Traceback (most recent call last):
  File "D:/Pychram/workplace/Tieba_search.py", line 24, in 
    with open('tieba.csv', 'w', encoding = 'UTF-8-BOM') as f:
LookupError: unknown encoding: UTF-8-BOM

你可能感兴趣的:(Python#爬虫)