Linux ubuntu TXT 乱码问题

年纪大了,容易忘事情,记录下来,今天先留下关于ubuntu系统下面.txt乱码的问题。

这个乱码的主要原因是中文编码的问题,windows下打开正常,linux下面打开就有问题了,要么如我,从网上下载了一个文件,linux里先打开,是乱码,然后去windows打开,亦然是乱码。根据网上提示,windows下编码用的是GB2312,而linux下则使用的是UTF-8,所以要想两方都能打开,那只有在编码方式上下功夫了。

检查文件编码方式:   file   --mime-encoding 文件名\file  文件名

网上说: GB2312是国家制定的汉字编码标准,使用双子节进行编码,共收入6763个汉字和682个非汉字图形字符。GBK即对国标编码的扩展,在GB2312的基础上进行扩展形成的,使用双子节编码方式,共收入21003个汉字,从而大大满足了汉字使用的需要。 iso8859采用单字节编码, GB2312采用双字节编码,兼容iso8859。而GBK是对gb2312的扩展,在双字节上增加了更多的汉字,所以可以采用GBK的方式进行转码。

所以直接改文件的编码格式的话刻意采用如下命令:      sudo iconv     -f    'gbk'   -t   'utf-8'  源文件名>目标文件名\  iconv  -f  gb2312 -t  utf-8  -c    源文件名>目标文件名

不过奇怪的是,直接使用  iconv -f iso-8859-1  -t  utf-8居然是不行的,文件编码格式貌似改了,但是打开依然是乱码。iconv -l检查了一下系统支持的编码格式,的确有iso8859,不过为什么转不了暂时还不明白。

当然也可以在windows下面将文件从GBK 转到utf-8,不过这个方法我没有试过,暂时不知道成功与否。
F:\>for /r C4-Literature %i in (*.txt) do iconv.exe -f gbk -t utf-8 %i > %~ni.txt

还有想法是将打开文件用的编辑器更改其默认编码方式,具体没有试过,可以参考如下链接尝试。

参考链接:
www.linuxdiyf.com/linux/29770.html
https://blog.csdn.net/G_66_hero/article/details/66475746
www.cnblogs.com/zhangchaoyang/articles/2140311.html

你可能感兴趣的:(Linux ubuntu TXT 乱码问题)