文件有utf-8 bom和utf-8无bom格式
python在读取文件首行数据时,如果是utf-8 bom格式的文件,则首行读取的是有bom信息的,和utf-8 无bom格式的文件是不同的
可以用编辑器另存为utf-8 without BOM,也可以在代码中采用codecs.open来处理
- import codecs
- with codecs.open("WikiData.txt", 'r', 'utf-8-sig') as in_file:
- for line in in_file.readlines():
或者可以使用文本编辑软件修改文件格式为utf-8无bom格式,比如使用notepad++