处理中文相关的文件经常遇到该报错:1、将中文写入文件;2、从文件中读取中文。
解决方法:
在python中有专门做转码处理的包codecs,官方说明;
写入和读取的两个范例:
1、写入
import codecs
fp = codecs.open(filename, 'w', encoding='utf-8')
fp.write(content)
fp.close()
2、读取
import codecs
for line in codecs.open(obs_filepath, encoding='utf-8'):
if line.find("白") > 1:
print("line.find", line.find("白"))
print("line", line)
fb = codecs.open(resultname, 'a+', encoding='utf-8')
fb.write(filepath + '\n' + line + '\n')
fb.close()