python处理文件首行的BOM问题

这个问题之前一直放过,烦了好久了,

用python的readlines方法读文件,首行总是会因为有一个小短横而报错。

在pycharm里就是这个样子,把那行复制出来又看不到小短横了。

python处理文件首行的BOM问题_第1张图片

这是文件首行的BOM在作祟。

UTF-8编码文件可分为utf-8和utf-8 without BOM两种,

可以用编辑器另存为utf-8 without BOM,也可以在代码中采用codecs.open来处理

# -*- coding: UTF-8 -*-
import codecs
with codecs.open("WikiData.txt", 'r', 'utf-8-sig') as in_file:
    for line in in_file.readlines():
        ...


你可能感兴趣的:(python)