UnicodeEncodeError: 'gbk' codec can't encode character '\U0001f914' in posit

原码

#保存爬取结果(微博评论)
result.to_csv('egg_comment.csv',encoding='gbk')

报错

UnicodeEncodeError: 'gbk' codec can't encode character '\U0001f914' in posit

原因
网上很多内容都是采用utf8编码的,gbk无法编码字符’\U0001f914’,所以’utf8’格式的数据被转成’gbk’,会因为无法编码unicode的某些字符而出错。
解决

result.to_csv('egg_comment.csv',encoding='gb18030')

更多常见编码

编码 语言
utf8 所有语言
gbk 简体中文
gb2312 简体中文
gb18030 简体中文
big5 繁体中文
big5hkscs 繁体中文

你可能感兴趣的:(报错)