Oracle字符集问题总结
1.1.1 oracle字符集概念
oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储,处理,检索数据。它使数据库工具,错误消息,排序次序,日期,时间,货币,数字,和日历自动适应本地化语言和平台。
影响oracle数据库字符集最重要的参数是NLS_LANG参数。格式:NLS_LANG =language_territory.charset
其中:Language 指定服务器消息的语言,territory 指定服务器的日期和数字格式,charset 指定字符集。如:AMERICAN _ AMERICA. ZHS16GBK。从NLS_LANG的组成我们可以看出,真正影响数据库字符集的其实是第三部分。所以两个数据库之间的字符集只要第三部分一样就可以相互导入导出数据,前面影响的只是提示信息是中文还是英文。
1.1.2 查询Oracle的字符集
在做数据导入的时候,需要这三个字符集都一致:一是oracel server端的字符集,二是oracle client端的字符集;三是dmp文件的字符集。
A.查询oracle server端的字符集
SQL>select userenv('language') from dual;
结果类似:AMERICAN_AMERICA.ZHS16GBK
或者select * from V$NLS_PARAMETERS;
B.如何查询dmp文件的字符集
dmp文件的第2和第3个字节记录了dmp文件的字符集。小dmp文件用UltraEdit打开(16进制方式),看第2第3个字节的内容,如0354,然后用以下SQL查出它对应的字符集:
SQL> select nls_charset_name(to_number('0354','xxxx')) from dual;
结果ZHS16GBK
dmp文件很大如2G以上,用文本编辑器打开很慢或者完全打不开,可以用命令(在unix主机上):
cat exp.dmp |od -x|head -1|awk '{print $2 $3}'|cut -c 3-6
然后用上述SQL也可以得到它对应的字符集。
C.查询oracle client端的字符集
windows注册表里面相应OracleHome的NLS_LANG(如果装配置台等将总共有3个:ORACLE下一个、ID0下有一个、HOME0下一个)。还可以在dos窗口里面自己设置,如:set nls_lang=SIMPLIFIED CHINESE_CHINA.ZHS16GBK这样就只影响这个窗口里面的环境变量;
在unix平台下,就是环境变量NLS_LANG。$echo $NLS_LANG 如AMERICAN_AMERICA.ZHS16GBK
如果检查的结果发现server端与client端字符集不一致,请统一修改为同server端相同的字符集(建议导入时直接在服务器上导入)
1.1.3 修改oracle的字符集
oracle的字符集有互相的包容关系。如us7ascii就是zhs16gbk的子集,从us7ascii到zhs16gbk不会有数据解释上的问题,不会有数据丢失。在所有的字符集中utf8应该是最大,因为它基于unicode,双字节保存字符(也因此在存储空间上占用更多)。
一旦数据库创建后,数据库的字符集理论上讲是不能改变的。字符集的转换是从子集到超集受支持,反之不行。如果两种字符集之间根本没有子集和超集的关系,那么字符集的转换是不受oracle支持的。一般来说,除非万不得已,我们不建议修改oracle数据库server端的字符集。特别说明,我们最常用的两种字符集ZHS16GBK和ZHS16CGB231280之间不存在子集和超集关系,因此理论上讲这两种字符集之间的相互转换不受支持。
A.修改server端字符集(不建议使用)
在oracle 8之前,可以用直接修改数据字典表props$来改变数据库的字符集。但oracle8之后,至少有三张系统表记录了数据库字符集的信息,只改props$表并不完全,可能引起严重的后果。正确的修改方法如下:
$sqlplus /nolog
SQL>conn / as sysdba;
若此时数据库服务器已启动,则先执行SHUTDOWN IMMEDIATE命令关闭数据库服务器,然后执行以下命令:
SQL>STARTUP MOUNT;
SQL>ALTER SYSTEM ENABLE RESTRICTED SESSION;
SQL>ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;
SQL>ALTER SYSTEM SET AQ_TM_PROCESSES=0;
SQL>ALTER DATABASE OPEN;
SQL>ALTER DATABASE CHARACTER SET ZHS16GBK;
SQL>ALTER DATABASE national CHARACTER SET ZHS16GBK;
SQL>SHUTDOWN IMMEDIATE;
SQL>STARTUP
B.修改dmp文件字符集
dmp文件的第2第3字节记录了字符集信息,因此直接修改dmp文件的第2第3字节的内容就可以'骗'过oracle的检查。这样做理论上也仅是从子集到超集可以修改,但很多情况下在没有子集和超集关系的情况下也可以修改,我们常用的一些字符集,如US7ASCII,WE8ISO8859P1,ZHS16CGB231280,ZHS16GBK基本都可以改。因为改的只是dmp文件,所以影响不大。
具体的修改方法比较多,最简单的就是直接用UltraEdit修改dmp文件的第2和第3个字节。比如想将dmp文件的字符集改为ZHS16GBK,可以用以下SQL查出该种字符集对应的16进制代码:
SQL> select to_char(nls_charset_id('ZHS16GBK'), 'xxxx') from dual;
0354
然后将dmp文件的2、3字节修改为0354即可。
RAC环境修改oracle字符集
2.1 RAC环境存在问题
在RAC环境下修改oracle服务器的字符集仍然按非RAC模式方法修改过程会遇到ORA-12720的错误信息
SQL>ALTER DATABASE CHARACTER SET ZHS16GBK;
ORA-12720:, operation requires database is in EXCLUSIVE mode. Cause:,
上述错误信息标明在RAC方式下无法对服务端字符集进行修改,需要将数据库运行在但实例模式运行。
2.2 解决该问题的尝试
为解决上述遇到的问题,尝试将两台机器cluster软件停止,在单节点上手工激活VG并启动oracle,又会遇到ORA-32700的错误。错误信息如下:
ora-32700 error occurred in DIAG Group Service
在很多情况下都会报ORA-32700的错误,在此处的原因大概是因为没有启动双机cluster软件导致,如果将单节点的cluster进程启动,oracle实例也会跟着启动,修改时又会出现2.1节遇到的错误。
2.3 RAC环境修改字符集步骤
2.3.1 数据库参数文件目录备份
为解决2.1节遇到错误就必须将数据库修改为单实例非cluster模式,需要对数据库参数文件进行修改,但进行参数文件修改需要一些窍门和方法。
正常RAC模式下ORACLE_HOME/dbs目录下文件如下列表
-rw-r--r-- 1 oracle dba 8385 Aug 17 16:18 init.ora
-rw-r--r-- 1 oracle dba 12920 Aug 17 16:18 initdw.ora
-rw-r--r-- 1 oracle dba 1424 Aug 17 16:18 initora92.ora
-rw-r--r-- 1 oracle dba 25 Aug 17 16:18 initora921.ora
-rw-r--r-- 1 oracle dba 25 Aug 17 16:18 initora922.ora
-rw-r----- 1 oracle dba 1536 Aug 17 16:18 orapw
-rwSr----- 1 oracle dba 1536 Aug 17 16:18 orapwora921
-rw-r----- 1 oracle dba 1536 Aug 17 16:18 orapwora922
两个数据库实例的pfile文件内容如下:
[icdnode1]$cat initora921.ora
SPFILE='/dev/rlv_spfile'
[icdnode1]$cat initora922.ora
SPFILE='/dev/rlv_spfile'
但initora92.ora文件是正常的有参数配置项目的文本文件,长度比较大,再次不列出内容。
虽然在dbs目录下并没有spfile文件,数据使用pfile启动,但pfile又制定了spfile文件的位置,数据库使用spfile文件启动。
上述的两个实例的pfile文件是无法修改的,需要将pfile文件修改为常规的文本文件配置项才能进行配置修改操作。
备份操作:
cd $ORACLE_HOME
cp �Cr dbs dbs_bak
2.3.2 修改数据库参数文件
修改数据库参数文件目的是修改配置项*.cluster_database=true → false,因此需要对pfile进行操作,可以用如下方法还原pfile文件。
正常启动RAC数据库的一个节点,另一个节点关机或停止cluster进程;
连接启动的实例并使用spfile配置生成pfile:
Sqlplus ‘/as sysdba’
SQL>create pfile from spfile;
SQL>exit
此时ORACLE_HOME目录的dbs目录中文件列表如下:
-rw-r--r-- 1 oracle dba 8385 Aug 17 16:15 init.ora
-rw-r--r-- 1 oracle dba 12920 Aug 17 16:15 initdw.ora
-rw-r--r-- 1 oracle dba 1425 Aug 17 16:29 initora92.ora
-rw-r--r-- 1 oracle dba 1425 Aug 17 16:32 initora921.ora
-rw-r--r-- 1 oracle dba 25 Aug 17 16:15 initora922.ora.bak
-rw-r----- 1 oracle dba 1536 Aug 17 16:15 orapw
-rwSr----- 1 oracle dba 1536 Aug 17 16:15 orapwora921
-rw-r----- 1 oracle dba 1536 Aug 17 16:15 orapwora922
可以看到initora921.ora文件长度由原来的25字节变成1425,与initora92.ora文件长度一致,也变成可编辑的文本文件。
initora92.ora和initora921.ora配置文件前几行是一致的,将true修改为false
*.aq_tm_processes=0
*.background_dump_dest='/home/oracle/app/oracle/admin/ora92/bdump'
*.cluster_database_instances=2
*.cluster_database=true
ora921.cluster_interconnects='192.168.1.1'
ora922.cluster_interconnects='192.168.1.2'
pfile文件修改完成后关闭此节点的cluster服务,数据库也随cluster关闭而关闭。
2.3.3 按非RAC模式操作指导修改字符集
将数据修改为非RAC模式后可按非RAC模式的操作指导进行修改操作,操作时需要手工激活oracle系统vg。
2.3.4 修改完成后备份恢复
在非RAC模式完成字符集修改完成后,关闭数据库将原dbs目录恢复,重新启动cluster软件,在两台机器两个实例查询oracle服务器端字符集已经成功修改。
2.4 RAC环境修改字符集快速步骤
总结上述操作步骤即操作过程,从理论上可以用以下步骤完成快速修改:
2.4.1 先修改spfile的参数
停止一个节点的cluster程序,在另一个节点执行
Sqlplus ‘/as sysdba’
SQL> Alter system set cluster_database=false scope=spfile;
SQL>exit
2.4.2 进行字符集修改
停止主节点的cluster程序,然后varyonvg oravg
然后用修改单机的操作步骤进行字符集修改。
2.4.3 恢复spfile配置和RAC模式
Sqlplus ‘/as sysdba’
SQL> Alter system set cluster_database=true scope=spfile;
SQL>shutdown immediate
SQL>exit
启动两个节点的cluster进程,进行验证测试。
RAC环境修改字符:
由于是rac环境和单实例的不太一样
1、查询当前的字符集
SQL> select userenv('language') from dual;
USERENV('LANGUAGE')
--------------------------------------------------------------------------------
AMERICAN_AMERICA.WE8ISO8859P1
sql> alter system set cluster_database=false scope=spfile sid='jscn1';
红色部分对于单实例的是不要加的,对于rac来说必须加上,不然会报
ORA-12720: operation requires database is in EXCLUSIVE mode
2、停止数据库(rac1和rac2都要停止)
SQL> shutdown immediate;
Database closed.
Database dismounted.
ORACLE instance shut down.
3、启动数据库(只在rac1上面操作)
SQL> startup nomount;
ORACLE instance started.
Total System Global Area 1577058304 bytes
Fixed Size 2084264 bytes
Variable Size 436208216 bytes
Database Buffers 1124073472 bytes
Redo Buffers 14692352 bytes
SQL> Alter database mount exclusive;
Database altered.
SQL> Alter system enable restricted session;
System altered.
SQL> ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;
System altered.
SQL> Alter database open;
Database altered.
4、修改字符集
SQL> ALTER DATABASE character set INTERNAL_USE zhs16gbk;
sql> alter system set cluster_database=true scope=spfile sid='jscn1';
5、验证(两个节点都要测)
Database altered.
SQL> SHUTDOWN IMMEDIATE;
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL> startup;
ORACLE instance started.
Total System Global Area 1577058304 bytes
Fixed Size 2084264 bytes
Variable Size 436208216 bytes
Database Buffers 1124073472 bytes
Redo Buffers 14692352 bytes
Database mounted.
Database opened.
SQL> select userenv('language') from dual;
USERENV('LANGUAGE')
--------------------------------------------------------------------------------
AMERICAN_AMERICA.ZHS16GBK
6、启动rac2,验证rac2的字符集(废话,公用一个数据库,当然一样了)
更改字符集简单:
SQL> conn /as sysdba
SQL> shutdown immediate;
SQL> startup mount
SQL> ALTER SYSTEM ENABLE RESTRICTED SESSION;
SQL> ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;
SQL> ALTER SYSTEM SET AQ_TM_PROCESSES=0;
SQL> alter database open;
SQL> ALTER DATABASE CHARACTER SET ZHS16GBK;
ORA-12712: new character set must be a superset of old character set
提示我们的字符集:新字符集必须为旧字符集的超集,这时我们可以跳过超集的检查做更改:
SQL> ALTER DATABASE character set INTERNAL_USE ZHS16GBK;
--我们看到这个过程和之前ALTER DATABASE CHARACTER SET操作的内部过程是完全相同的,也就是说INTERNAL_USE提供的帮助就是使Oracle数据库绕过了子集与超集的校验.
SQL> shutdown immediate;
SQL> startup
以后安装oracle的时候记得选择自定义安装,把这个字符集的事情事先弄好。