python处理文件首行读取问题 utf-8 BOM

文件有utf-8 bom和utf-8无bom格式

python在读取文件首行数据时,如果是utf-8 bom格式的文件,则首行读取的是有bom信息的,和utf-8 无bom格式的文件是不同的


可以用编辑器另存为utf-8 without BOM,也可以在代码中采用codecs.open来处理

[python]  view plain  copy
 
  1. import codecs  
  2. with codecs.open("WikiData.txt"'r''utf-8-sig') as in_file:  
  3.     for line in in_file.readlines():  
或者可以使用文本编辑软件修改文件格式为utf-8无bom格式,比如使用notepad++


你可能感兴趣的:(python)