达梦数据库支持GB18030-2022中文编码字符集证明方法

既然是证明就要做到有图有真相。

证明途径1:系统概览法

查看达梦数据库“管理工具”->“对象导航”->“管理服务器”-“系统概览”->“字符集编码”->”GB18030”.

达梦数据库支持GB18030-2022中文编码字符集证明方法_第1张图片

达梦数据库支持GB18030-2022中文编码字符集证明方法_第2张图片

看见”GB18030”字样就是证据之一。如果你没有看见这个字样,而是UTF8等其他字样,请重新安装产品吧,安装向导时记得选择“GB18030”,再继续安装。

证明途径2:函数查询法

查看达梦数据库的手册->“DM8_SQL手册”->附录3“系统存储过程和函数”->“系统信息管理”->“9) SF_GET_UNICODE_FLAG/UNICODE ”

达梦数据库支持GB18030-2022中文编码字符集证明方法_第3张图片

我们来执行一下试试,看这个系统函数返回多少呢?

达梦数据库支持GB18030-2022中文编码字符集证明方法_第4张图片

达梦数据库支持GB18030-2022中文编码字符集证明方法_第5张图片

看见”0”字样就是证据之一。如果你没有看见这个“0”结果值,而是1、2等其他数值,请重新安装产品吧,安装向导时记得选择“GB18030”,再继续安装。

证明途径3:国标对照测试法

有人说,上面只能证明支持GB18030,但是不知支持的时GB18030的2000版(第一版)、2005版(第二版)还是2022版(第三版),所以无法证明支持GB18030-2022?毕竟GB18030-2022共定义了8万多汉字,比2005版汉字多得多,不能证明其支持。

达梦数据库支持GB18030-2022中文编码字符集证明方法_第6张图片

 我下面拿国标来做个测试:

打开2022年8月发布的GB18030-2022《信息技术 中文编码字符集》文件,查看到关于汉字及汉字部首部分主要增加的部分集中在d)、e)、f)、g)、h)、i),共6个部分,这6个部分涉及的字符数量太多,有17886个,我们每个部分只做首尾的手工测试,全量测试则主要用脚本测。

手工测试方法:

select  '0x82358F33' GB18030_code,bintochar('0x82358F33') GB18030_SYMBOLS

union all 

select  '0x82359636' GB18030_code,bintochar('0x82359636')  GB18030_SYMBOLS

union all 

select  '0x9835F738' GB18030_code,bintochar('0x9835F738')  GB18030_SYMBOLS

union all 

select  '0x98399E36' GB18030_code,bintochar('0x98399E36')  GB18030_SYMBOLS

union all 

select  '0x98399F38' GB18030_code,bintochar('0x98399F38')  GB18030_SYMBOLS

union all 

select  '0x9839B539' GB18030_code,bintochar('0x9839B539')  GB18030_SYMBOLS

select  '0x9839B632' GB18030_code,bintochar('0x9839B632')  GB18030_SYMBOLS

union all 

select  '0x9933FE33' GB18030_code,bintochar('0x9933FE33')  GB18030_SYMBOLS

union all 

select  '0x99348138' GB18030_code,bintochar('0x99348138')  GB18030_SYMBOLS

union all 

select  '0x9939F730' GB18030_code,bintochar('0x9939F730')  GB18030_SYMBOLS

union all 

select  '0x81398B32' GB18030_code,bintochar('0x81398B32')  GB18030_SYMBOLS

union all 

select  '0x8139A035' GB18030_code,bintochar('0x8139A035')  GB18030_SYMBOLS;

达梦数据库支持GB18030-2022中文编码字符集证明方法_第7张图片

我们找到这些编码对应的页,查看其字形是否显示正确。

我们在国标GB18030-2022的page160页,找到了编码为“82358F33”的汉字字形,确实是“一个火加上一个常”,和标准上显示的汉字字形一样。

达梦数据库支持GB18030-2022中文编码字符集证明方法_第8张图片

 其他的字形相符性的证据,我就不一一截图供大家对比,大家去700多页的新版国标里找吧。

最新版国标新增的6个部分,通过上述验证,每个部分抽了2个字符进行测试,编码和字形是完全符合最新版国标要求的。达梦公司已通过脚本方式将1.7万个新增字符全部进行测试。

鉴于篇幅缘故,故不再此展示,有兴趣的同学可以自己动手试试。

证明途径4:权威机构的认证证书法

达梦数据库在4-5月份将产品送测到CESI机构进行检查,检测机构会将GB18030-2022上87887个汉字全部测试一遍。估计今年(2023年)的9-10月份就会拿到国标GB18030-2022的认证证书,到时候可以拿认证证书进行最权威的证明,大家敬请期待。

达梦数据库如何正确配置使之支持GB18030-2022信息技术中文编码字符集,请看下个博客。

达梦数据库打开GB18030-2022编码的SQL文件时有乱码怎么处理,请看下个博客。

你可能感兴趣的:(数据库,java,sql)