前言:
将表导入数据库后,发现很多的乱码,而原数据在原库中是没有问题的,找了很多资料来看,发现可能是字符集的问题,检查处理后,问题得到了解决,撰文记之:
oracle数据库常用的字符编码格式为ZHS16GBK,下面就是更换字符集实操的记录:
[oracle@woitumi-197 dbs]$ sqlplus / as sysdba
启动数据库:
SQL> startup
SQL>shutdown immediate;
SQL>STARTUP MOUNT;
SQL>ALTER SYSTEM ENABLE RESTRICTED SESSION;
SQL>ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;
SQL>ALTER SYSTEM SET AQ_TM_PROCESSES=0;
SQL>ALTER DATABASE OPEN;
SQL>ALTER DATABASE CHARACTER SET ZHS16GBK;
接下来可能出现两种情况:
ERROR at line 1 RA-12721: operation cannot execute when other sessions are active
1、若出现上面的错误,使用下面的办法进行修改,使用INTERNAL_USE可以跳过超集的检查:
SQL>ALTER DATABASE CHARACTER SET INTERNAL_USE ZHS16GBK;
2、结果报错,提示新字符集必须是老字符集的超集。
ORA-12712: new character set must be a superset of old character set
RROR at line 1:
需要强制转换:
>ALTER DATABASE character set INTERNAL_USE ZHS16GBK;
以上两种情况是我所遇到的问题,在执行了相关命令后,执行最后步骤:
>shutdown immediate;
>STARTUP;
附:
在数据库备份文件导入时,
1. oracel server端的字符集;
2. oracle 远程连接工具的字符集;
3. 导出dmp文件数据库的的字符集。
这三者必须相同,操作后的数据,才不会出现乱码
查询方法:
查询oracle server端的字符集
有很多种方法可以查出oracle server端的字符集,比较直观的查询方法是以下这种:
SQL> select userenv('language') from dual;
USERENV('LANGUAGE')
----------------------------------------------------
SIMPLIFIED CHINESE_CHINA.ZHS16GBK
SQL>select userenv(‘language’) from dual;
AMERICAN _ AMERICA. ZHS16GBK
如何查询dmp文件的字符集
用oracle的exp工具导出的dmp文件也包含了字符集信息,dmp文件的第2和第3个字节记录了dmp文件的字符集。如果dmp文件不大,比如只有几M或几十M,可以用UltraEdit打开(16进制方式),看第2第3个字节的内容,如0354,然后用以下sql查出它对应的字符集:
SQL> select nls_charset_name(to_number('0354','xxxx')) from dual;
ZHS16GBK
如果dmp文件很大,比如有2G以上(这也是最常见的情况),用文本编辑器打开很慢或者完全打不开,可以用以下命令(在linux主机上):
cat exp.dmp |od -x|head -1|awk '{print $2 $3}'|cut -c 3-6