ubuntu中文件编码转换

ubuntu中文件编码转换

1 文件名编码转换
从Linux往windows 拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名中文编码默认为 GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。 在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。 首先看一下你的系统上是否安装了convmv,如果没安装的话用: yum -y install convmv 安装。
下面看一下convmv的具体用法: convmv -f 源编码 -t 新编码 [选项] 文件名 常用参数
-r 递归处理子文件夹 –notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
–list 显示所有支持的编码
–unescap 可以做一下转义,比如把%20变成空格比如我们有一个utf8编码的文件名,转换成GBK编码,
命令如下: convmv -f UTF-8 -t GBK –notest utf8 编码的文件名
这样转换以后”utf8编码的文件名”会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)。
注意:不要在NTFS和FAT文件系统中使用此命令,否则可能产生意外结果,如果要在Linux中正确的显示NTFS和 FAT的中文件名,可以通过mount参数来解决,具体方法查看一下man手册。


2 文件编码转换
1)在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 :set fileencoding=utf-8 
2)iconv 转换,iconv的命令格式如下: iconv -f encoding -t encoding inputfile 比如将一个UTF-8 编码的文件转换成GBK编码 iconv -f GBK -t UTF-8 file1 -o file2

3)enconv 转换文件编码比如要将一个GBK编码的文件转换成UTF-8编码,操作如下 enconv -L zh_CN -x UTF-8 filename

 

Ubuntu环境,默认是utf8,现将其设置为GBK的方法

用ubuntu,文件从window上传到ubuntu后会显示乱码,原因时因为ubuntu环境设置默认是utf8,windows默认都是GBK,对拷的文件转化后就会乱码。只好手动将ubuntu环境设置为GBK
1、首先设置sudo vi /var/lib/locales/supported.d/local
添加一行 zh_CN.GBK GBK
2、sudo locale-gen
3、修改/etc/environment
PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games"
#中文界面UTF8配置 %%目前默认配置
LANGUAGE="zh_CN:zh:en_US:en"
LANG="zh_CN.UTF-8"
LC_ALL="zh_CN.UTF-8"
GST_ID3_TAG_ENCODING=GB2312

#中文界面GBK配置  %%这样设置还是有问题,求达人求解
#LANGUAGE="zh_CN:zh:en_US:en"
#LANG="zh_CN.GBK"
#LC_ALL="zh_CN.GBK"
#GST_ID3_TAG_ENCODING=GBK
#LC_CTYPE=zh_CN.GBK

#英文界面配置
#LANGUAGE="en_US:en"
#LANG=en_GB.UTF-8
#LC_CTYPE=zh_CN.UTF-8
#GST_ID3_TAG_ENCODING=GBK
4、接下来重启服务器就行了 reboot init 6 now 或者直接reboot。


参考: http://hi.baidu.com/jerry916/item/80a1c75c7ba4cf17da16359c


你可能感兴趣的:(ubuntu中文件编码转换)