解决办法:
一种是将生僻字的数据类型由varchar2改成nvarchar2,并使用utl_raw.cast_to_nvarchar2函数来插入和查询数据。这种动作较小。
另一种是将数据库的字符集修改为支持更多汉字的字符集,例如AL32UTF8或ZHS32GB18030。 这种需要删除数据库,重新建库,动作较大,其实经过测试显示仍然有问题。
例如生僻字:㼆 yíng ,㱔 suǒ,䶮 yǎn
– 解决Oracle存储生僻字、偏僻字
– 只能保证业务系统能正常读取生僻字
DROP TABLE TEST;
CREATE TABLE TEST(id int,n1 varchar2(255), n2 nvarchar2(255));
insert into TEST values(0,‘张学䄲友’,‘张学䄲友’);
insert into TEST values(1,n’张学䄲友’,n’张学䄲友’);
insert into TEST VALUES(0,‘㱔’,‘㱔’);
insert into TEST VALUES(1,‘㱔’,N’㱔’);
insert into TEST VALUES(1,‘㛃’,N’㛃’);
insert into TEST VALUES(0,‘䶮’,‘䶮’);
insert into TEST VALUES(0,‘㼆’,‘㼆’);
– 中文转unicode参考:https://www.w3cschool.cn/tools/index?name=unicode_chinese
insert into TEST select 1,utl_raw.cast_to_varchar2(‘3c54’),utl_raw.cast_to_nvarchar2(‘3c54’)from dual;
insert into TEST select 1,utl_raw.cast_to_varchar2(‘36c3’),utl_raw.cast_to_nvarchar2(‘36c3’)from dual;
commit;
– ID为1且n2列为正确的插入方法
SELECT n1,n2 FROM TEST;
– 补充
– 测试 sql
select n’䄲’ from dual; – 显示正常
select ‘䄲’ from dual; – 显示乱码
历史数据处理
– 第一步: 将需要存储生僻字的字段类型修改为 nvarchar2 (注意:不是 varchar2)
alter table TEST modify N1 nvarchar2(255);
– 第二步: 手工通过数据库图形化工具 将生僻字转换后 插入该字段(单引号前面加上 n)
update TEST set sqrmc = n’张学䄲友’ where sblsh = ‘44180022B0000NJ’;
commit;
– 第三步: 进入业务系统页面查看 正常显示为 《 张学䄲友 》
Oracle中varchar2和nvarchar2的区别主要有以下几点:
varchar2是可变长度的字符类型,最多可以存放4000字节的数据,而nvarchar2是可变长度的国家字符类型,最多可以存放2000个字符。
varchar2的长度单位可以是字节或字符,取决于type参数,而nvarchar2的长度单位只能是字符。
varchar2在存储汉字时受到数据库字符集编码的影响,例如GBK编码时一个汉字占两个字节,UTF-8编码时一个汉字占三个字节。而nvarchar2在存储汉字时不受数据库字符集编码的影响,一个汉字始终占两个字节。
varchar2和nvarchar2在插入和查询数据时可能需要使用不同的函数来转换数据类型。
1、若Oracle数据库字符集为ZHS16GBK,则必须同时满足如下2个条件,才能避免生僻字乱码:
字段必须修改为nvarchar2类型
插入或修改在字符串前加上“N”或者使用utl_raw.cast_to_nvarchar2(‘unicode码’)来插入。
2、绝大多数生僻字,在UTF8字符集中都是存在的,也就是在Oracle数据库的 AL32UTF8 字符集中都能够被正确存储。
3、若数据库为UTF8格式,则建议使用正常方式来操作,若还有乱码,则可以修改NLS_LANG参数,
export NLS_LANG=AMERICAN_AMERICA.AL32UTF8
转载自https://mp.weixin.qq.com/s/sLkQpURK-l7yar1SbiKGQA