Linux与Windows间的编码

 
在 Debian Linux 中用 VirtualBox 虚拟了一个 Windows XP。但遗憾的是,Windows XP 的默认编码格式是 GBK,而我的 Linux 编码格式是 UTF-8。这就给两者的中文操作形成困扰。不过VIM编辑器可以很平滑地解决这个问题,具体做法是在Windows和Linux下分别设置两者的VIM配置,设置如下:

A) Windows XP 下VIM配置:

vim  C:\Program Files\vim\_vimrc

....
set fileencodings=cp936,utf-8,ucs-bom          " VIM打开文件时,可以认识的文件编码
set encoding=utf-8                                                " VIM编辑文件时,屏幕显示文件的编码
set fileencoding=cp936                                        " VIM存储文件时,硬盘存储文件的编码
...

B) Linux 下VIM设置:

vim ~/vimrc

...
set fileencodings=cp936,utf-8,ucs-bom
set encoding=utf-8
set fileencoding=utf-8
...

完成上述设置后,无论在Windows XP下,还是在Linux下,编辑文件时都是UTF-8编码。但存储文件的编码不一样,Windows XP 将文件存储成 cp936(GBK)编码,但Linux将文件存储成UTF-8编码。

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

一、查看文件编码:

在Linux中查看文件编码可以通过以下几种方式,例如:在 Vim 中可以直接查看文件编码

:set fileencoding

即可显示文件编码格式。

二、文件编码转换:

1). 如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在~/.vimrc文件中添加以下内容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

其中 encoding 是 vim 的默认显示编码格式,fileencodings 是 vim 打开文件时检测的编码格式,存在这种类型的编码即转换为utf-8编码。这样,就可以让 vim 自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照 fileencodings 提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

2). 在Vim中直接进行转换文件编码:

比如将一个文件转换成utf-8格式

:set fileencoding=utf-8

3). iconv 转换:

iconv的命令格式如下:

iconv -f encoding -t encoding inputfile

比如将一个UTF-8 编码的文件转换成GBK编码

iconv -f GBK -t UTF-8 file1 -o file2

你可能感兴趣的:(windows,linux,Debian,vim,存储,encoding)