INFORMIX字符集相关知识

 INFORMIX字符集相关知识 收藏

字符集的基本知识

如果从头说起,字符集最早的编码方案来自于ASCII,这也是最常见的编码方式。该方案起源于20世纪60年代初期,
最初是美国国会图书馆制定用来作为美国图书馆界书目交换的共同标准,最后完善成为美国的国家标准ASCII(American
Standard Code for Information Interchange),之后进一步演变成世界性的计算机字符编码标准ISO646(其全名为
7-bit coded character set for information interchange),于是成为计算机编码方案的基础。

Informix 数据库最早支持的编码方案也就是en_US.8859-1.
由于英文字符一般是以一个字节来存储的,7位的编码方案最多只能代表128个字符;经过扩展的8为编码方案也能
代表256个字符,这远远不能满足计算机发展的需要,对于亚洲国家复杂的字符存储需要更多的码位,于是各种编码方案
随之而生。

为了容纳全世界各种语言的所有字符和符号,解决不同编码之间的兼容和转换问题,1991年1月,十多家公司共同出资,
组建Unicode协会,随后Unicode编码产生了。

Unicode 协会的口号是:给每个字符提供一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。
最初Unicode编码使用2-Byte(16bit)来进行编码,但是最多只能容纳65536个字符,仍然不够使用,后来进行了
扩充,也就是Unicode 3.1标准,增加了额外的补充字符定义,现在Unicode 5.0标准已经发布,具体参考Unicode
官方站点(http://www.unicode.org)。Unicode 主要有3个实施标准:UTF-8,USC-2和UTF-16。Informix通过Informix
International Language Supplement 支持UTF-8。

根据各种不同标准的含义,如果数据库需要存放不同语言的不同字符和符号,需要进行跨数据库的数据交换
与分析,一般建议使用Unicode编码方案。当然,Unicode方案可以表示更多的字符,但是由于多位的存储,需要额外
的存储空间和网络传输,所以选择最适合的数据库字符集仍然需要慎重考虑。

一、查看数据库字符集

有如下两种方式:

A.

dbaccess dbname

select site from systables where tabname=' GL_COLLATE'

B.

dbaccess sysmaster

select * from sysdbslocale

二、查看支持字符集情况

A.

操作系统

locale -a |grep -i 字符集名

B.

INFOMRIX的GLS

cd $INFORMIXDIR

plfiles

查看lc11.txt文件信息

三、如何设置字符集

由于INFORMIX数据库的字符集是对整个实例有效,默认字符集为:en_US.819

其他字符集可以通过如下方式进行设置(只有数据库初始安装时才可以修改),以UTF-8字符集为例。

在Informix环境变量中添加

export LANG=ZH_CN.UTF-8

export DB_LOCALE=zh_cn.utf8
export CLIENT_LOCALE=zh_cn.utf8

重新初始化数据库,新的数据库支持UTF8字符集。

你可能感兴趣的:(数据库,存储,扩展,Informix,语言,character)