字符集就是一套文字符号及其编码。常用的字符集有:
GBK 定长 双字节 不是国际标准,支持的系统不少
UTF-8 非定长 1-4字节广泛支持,MYSQL也使用UTF-8
当然了,字符集还有很多,以后再深入学习这部分内容。
①linux系统下的字符集由变量LANG控制。
[root@gagarin ~]# echo $LANG
zh_CN.GB18030
②export LANG="ZH_CN.GB18030"(临时变更字符集,重启后失效)
③在/etc/sysconfig/i18n文件中,行首添加:(配置永久生效)
LANG="ZH_CN.GB18030"
并把之前的字符集行注释“#”
. /etc/sysconfig/i18n(使修改生效)
④echo 'export LANG="ZH_CN.GB18030"' >>/etc/profile(全局系统环境变量配置文件)
source /etc/profile(生效)
echo $LANG(查看结果)
⑤工作场景中使用的脚本,为避免中文乱码,有时候也会在脚本里更改字符集:
#!/bin/sh
export LANG="ZH_CN.GB18030"
(脚本内容)
⑥SSH工具(SecureCRT)要与linux的字符集保持一致。
在SecureCRT的“会话选项”对话框,“终端”→“外观”类里,“字符编码”中的选项要和linux保持一致。
linux使用的字符集为“ZH_CN.GB18030”,SecureCRT的选项里设置为“默认”即可。
⑦服务端和客户端字符集对应,乱码就可以有效避免。
中文字符集:ZN_CN.GB18030
字符集变量:LANG
字符集配置文件:/etc/sysconfig/i18n
⑧echo命令(单行文本的追加)
source与.(修改后的变量生效)
export命令(设置环境变量)
使用centos支持中文
安装中文语言包:
yum groupinstall chinese-support
修改字符编码配置,没有这个文件就创建它:
vim /etc/sysconfig/i18n
修改后内容如下:
LANG="zh_CN.UTF-8"
SUPPORTED="zh_CN:zh:en_US.UTF-8:en_US:en:zh_CN.GB18030"
SYSFONT="latarcyrheb-sun16"
i18n文件是用来设置系统语言,比如:zh_CN.UTF-8、zh_CN.GB18030、zh_TW.Big5、en_US.UTF-8等。
i18n中三个环境变量:
LANG变量,设置系统语言。
SUPPORTED变量决定系统支持的语言,即系统能够显示的语言。
SYSFONT变量表示系统字体。
最后重启服务器:reboot
在linux下有时候需要编辑、查看windows下的文件,这样会经常遇到文件编码转换的问题,在windows中默认的文件格式在linux下看起来就有可能是乱码了(由于linux下的编码一般是utf-8的),这就需要进行编码转换。
一、查看文件编码。
在打开文件的时候输入:set fileencoding
即可显示文件编码格式。
二、文件编码转换
1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
在打开的文件中输入:set fileencoding=utf-8
2、使用iconv转换,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2
三、文件名编码转换:
从linux往windows 拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名 中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。
在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。
1、先看一下你的系统上是否安装了convmv,如果没安装的话在终端输入下面的命令安装:
sudo yum -y install convmv
2、下面看一下convmv的具体用法:
convmv -f 源编码 -t 新编码 [选项] 文件名
常用参数:
-r 递归处理子文件夹
--notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
--list 显示所有支持的编码
--unescap 可以做一下转义,比如把%20变成空格
比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:
convmv -f UTF-8 -t GBK --notest utf8编码的文件名
这样转换后"utf8编码的文件名"会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)
1、下载
可到http://www.vim.org/下载最新的7.3版本的vim源码。
2、安装
在编译之前,先要./configure --help查看一下配置选项,其中这个配置需要加进来:--enable-multibyte
其作用是支持多字节编码,这一步应该是很重要。在配置好了以后,自然是make 、make install了
3、最后是vimrc的脚本配置了
编辑~/.vimrc文件,加上如下几行:
set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936
set termencoding=utf-8
set encoding=utf-8
即可搞定。