字符集问题

部分内容来自:https://blog.csdn.net/haiross/article/details/18225415
在日常工作中,我在进行导入导出的时候,出现了这样一个问题,经过翻阅资料,找到了原因
我的数据库版本是Oracle 10g的
错误如下
字符集问题_第1张图片

export file created by export:v10.02.01 via conventional path
import done inus7ascll characterset and al16utf16 nchar character set
import server uses zhs16gbx character set possible charset conversion
export client uses zhs16gbx character set possible charset conversion
import terminated successfully without warnings

意思大概是
导出文件由export创建:v10.02.01通过常规路径
导入完成inus7ascll字符集和al16utf16 nchar字符集
导入服务器使用zhs16gbx字符集可能进行字符集转换
导出客户端使用zhs16gbx字符集可能进行字符集转换
导入在没有警告的情况下成功终止
应该是字符集的问题
我查看了导入时的日志:
在这里插入图片描述
我在使用
select userenv('language') from dual; 查看了原服务器和新服务器数据库的字符集
字符集都是ZHS16GBK的
后来查看资料发现不是服务端字符集的问题,而是客户端字符集的问题,
我在注册表里面
HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\KEY_OraDb11g_home1
NLS_LANG配置文件中把字符集改成了ZHS16GBK
恢复正常
后来,我总结了一下字符集的问题:总结如下
字符集问题_第2张图片
如图,为了说明问题,我们将服务器与客户端分开,客户端用应用程序比如sqlplus或者PL/SQL与服务端相连。

服务端有两个字符集:服务端操作系统字符集(4)、服务端数据库字符集(1);

客户端有一个字符集:客户端操作系统字符集(2);

客户端有一个参数:操作系统参数NLS_LANG(3)。

这三个字符集与一个参数中,有一个字符集对整个架构的运行没有影响,它就是服务端操作系统字符集(4),所以这个字符集将不再出现在我们的讨论过程中。

为什么这个服务端操作系统字符集没有用呢?这是因为Oracle在存取字符时与客户端进行字符集确认与转码的过程是由Oracle数据库自身完成的,不需要经过Oracle数据库所在的服务器的帮助。具体的是怎么回事用以下例子说明一下。

比如在Oracle数据库中有一个表,用如下语句创建:

create table test(name varchar2(10));

为了说明问题假定有这样的一个环境:服务器端Oracle数据库的字符集是UTF8,客户端操作系统字符集是ZHS16GBK,客户端NLS_LANG参数设置为ZHS16GBK。

那么从客户端应用程序(比如sqlplus)发出这样一条命令:
insert into test (name) values(‘中国’);
首先,这里有一个字符串“中国”,客户端操作系统用ZHS16GBK对它进行编码,比如编成“167219”,并把它交给sqlplus程序,然后把它发送给Oracle数据库。接着,Oracle数据库收到一串编码“167219”,不是直接往数据库里一扔就完事的,它要问客户端操作系统:“请问你给我的这串代码是用什么格式编码的啊?”客户端操作系统怎么回答?它会这么回答:“编码格式请参照参数NLS_LANG”。Oracle数据库一看,NLS_LANG=‘ZHS16GBK’,这个编码格式与Oracle数据库自身的编码格式“UTF8”不一样,然后就是Oracle数据库发挥自己专长的地方了,为什么呢?因为Oracle数据库有它自己的编码表,而且不是一张而是好多张编码表,它可以根据编码表对编码进行翻译和转码。这就好比Oracle数据库是一个翻译,它会好几国语言,牛人一个。像上面的这个情况,Oracle会把“167219”这串代码拿过来,根据参数NLS_LANG查ZHS16GBK编码表,找到对应这串代码的字符“中国”,然后再到UTF8编码表中查“中国”对应的编码,比如查到的结果是“3224678”。
最后,将转码之后的编码“3224678”存放到Oracle数据库中去。

为了进一步说明问题,我们再执行一条语句:

select name from test;

首先,Oracle数据库会从数据库中取出一串代码“3224678”。

接着,Oracle数据库不是直接把这串代码交给sqlplus程序,它会多问一句:“代码串我是取出来了,它是UTF8编码格式的,请问sqlplus,你希望要什么编码格式的?”,sqlplus仍然会很爽快地告诉Oracle数据库:“编码格式请继续参照参数NLS_LANG”。Oracle数据库一看,ZHS16GBK跟UTF8又不一样,所以先查UTF8编码表,找到编码“3224678”对应的字符“中国”,再查ZHS16GBK编码表,找到“中国”对应的编码“167219”,然后就是把最后得到的这串编码“167219”交给sqlplus程序。

最后,sqlplus直接把得到的这串编码扔给客户端操作系统,而操作系统只有ZHS16GBK编码表,它不会问得到的这串编码是什么格式的,只会直接到ZHS16GBK编码表中去查“167219”对应的字符是什么,并把它交给应用程序显示出来。这个显示的结果是“中国”。

以上就是一个完整的从客户端编码并经过Oracle数据库转码存入数据库,然后从数据库取出并转码交给客户端显示的实验。

总结如下:
1、Oracle数据库如何选择字符集?只有一个原则,那就是这个字符集要包含数据库运行过程中所能存入的数据字符,通常作为中国人我们选择ZHS16GBK,如果想再保险一点,选择AL32UTF8。

2、服务器操作系统选择什么字符集?这个字符集与数据库字符集一点关系都没有,系统管理员想选择什么就选择什么。

3、客户端操作系统选择什么字符集?我选择ZHS16GBK。

4、客户端操作系统参数NLS_LANG参数如何设置?这个只有一个设置方法,那就是与操作系统字符集相同。要不然会出问题的……

查询oracle server端的字符集

select userenv('language') from dual;

查询oracle client端的字符集
在windows平台下,就是注册表里面HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\KEY_OraDb11g_home1
注册表在运行界面–regedit 进入

你可能感兴趣的:(字符集问题)