【问题】
在Linux中使用Vim编写Python程序,其中包含中文字符,例如:
# -*- coding: utf-8 -*-
def combine():
combine_sheet.append(['创建时间', '浏览人数'])
运行程序后报错SyntaxError:(unicode error) 'utf8' codec can't decode byte 0xc0 in position 0: invalid start byte
这种报错说明保存的程序文件不支持中文字符,最好是转化为utf-8格式。
【解决方法】
确定编写的程序保存的编码格式以及解决方法如下:
(1)用Vim打开该程序文件,在命令模式下输入:set fileencoding即可查看该文件的编码格式。如果是非utf-8,则需要将该文件的编码格式设置为utf-8。
(2)设置方法:在命令模式下输入命令:set fileencoding=utf-8即可。然后可以通过上面的命令确认是否设置成功。
设置完成后重新执行该Python程序,结果执行成功。
【经验教训及总结】
我在解决该问题时走的弯路是没有一开始确认这个文件是以什么编码格式保存的,直接是通过以下两种方法修改程序代码:
(1)combine_sheet.append([unicode('创建时间').encode("utf-8"), unicode('浏览人数').encode("utf-8")])
(2)combine_sheet.append([u"创建时间".encode("utf-8"), u"浏览人数".encode("utf-8")])
结果还是报相同的错误。最后发现原来是文件保存的编码格式不支持中文,所以修改代码是解决不了这个问题的。
因此对于此类编码格式的问题,应该先确定文件保存的编码格式是否正确,然后再查找代码中是否有对编码格式做出正确的处理。
解决该问题时的参考资料:
(1)《Python脚本语法错误:SyntaxError:(unicode error) 'utf8' codec can't decode byte 0xc0 in position 0: invalids》,网址:https://blog.csdn.net/autumn20080101/article/details/8806906
(2)《VIM查看文件编码 文件编码格式转换 文件名编码转换.》,网址:https://www.cnblogs.com/joeblackzqq/archive/2011/04/11/2012008.html