这个问题之前一直放过,烦了好久了,
用python的readlines方法读文件,首行总是会因为有一个小短横而报错。
在pycharm里就是这个样子,把那行复制出来又看不到小短横了。
这是文件首行的BOM在作祟。
UTF-8编码文件可分为utf-8和utf-8 without BOM两种,
可以用编辑器另存为utf-8 without BOM,也可以在代码中采用codecs.open来处理
# -*- coding: UTF-8 -*-
import codecs
with codecs.open("WikiData.txt", 'r', 'utf-8-sig') as in_file:
for line in in_file.readlines():
...