Python读取txt、csv等文件出现\ufeff、\u202a等非法字符解决方法

在利用Python读取txt、csv等文件时,有时会出现\ufeff、\u202a等非法字符,其若出现在解析文件路径中,如txt文件中为文件路径的话,通常会出现如下错误:“OSError: [WinError 123] 文件名、目录名或卷标语法不正确”,不注意非法字符的话,很难解决。

下面给出两种具体的解决方法,如下:

1. 将要读取的文件的编码方式由“UTF-8”改为“UTF-8-sig”,示例代码如下:

with open('keywords.txt',mode="r", encoding='utf-8-sig') as f:

2. 不改变编码方式,手动去除非法字符,注意非法字符是不显示的:

path_dir = f.readline().strip('\ufeff')

 

 

 

参考:

1. python的"\ufeff"

2. python 字符串转列表出现\ufeff的解决方法

你可能感兴趣的:(计算机系统)