ubuntu下txt文件编码转换、查询(gbk/ISO-8859->utf-8)

在ubuntu下运行python程序,总是报错,说编码不对不是utf-8(貌似是因为汉字部分出问题了),搜集资料后完成了转换。

1.文件编码查询

$ file 199801.txt
199801.txt: ISO-8859 text, with very long lines, with CRLF, LF line terminators

2.完成转换

$ sudo iconv -f 'gbk' -t 'utf-8' 199801.txt > 199801_utf8.txt

3.不放心的可以再查一下

$ file 199801_utf8.txt
199801_utf8.txt: UTF-8 Unicode text, with very long lines, with CRLF, LF line terminators

此时编码转换已经完成,可以看到汉字部分已经正常了,o**k

你可能感兴趣的:(ubuntu)