ALT+数字,可输入汉字 good

各种编码查询表:http://bm.kdd.cc/

输入 ALT + 50385 就出 难 字了,原因是它的十六进制ANSI编码是C4D1=50385

同理:

汉=BABA=47802
字=D7D6=55254
中=D6D0=54992
文=CEC4=52932
国=B9FA=47610
华=BBAA=48042
夏=CFC4=53188
吴=CEE2=52962
难=C4D1=50385

但不知这种方法只支持GB2312,还是支持GBK,估计是GBK(即当前的ANSI编码)

这种方法还可输入ANSI和扩展ANSI:
A=65
€=128
À=192
æ=230


同时查得Unicode编码:
汉=FFFE49=16776777,输出结果却是:蘒
字=6C575B=7100251,输出结果却是:W
可见的这种输入方法不支持Unicode

GBK的存储方式是大头存储,但Unicode是小头存储,参考:
http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

----------------------------------------------------------
GBK定义之字符较CP936多出95字,皆为其时未收入ISO 10646 / Unicode之符号。CP936中的这95字分配到了Unicode的私有区域,现已全部收于新版Unicode。
因此,现在GBK的所有字符已经全部收录于Unicode中。

UTF-8作为Unicode的一种编码方法,可以表述所有的Unicode字符。
结论:UTF-8可以表述所有的GBK字符。

----------------------------------------------------------
GBK对应的code page是CP936。
微软也为GB18030定义了code page:CP54936

GBK是GB2312的扩展,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名。
在简体中文windows系统下,ANSI编码代表GBK/GB2312编码,ANSI通常使用0x80~0xFF范围的2个字节来表示1个中文字符。0x00~0x7F之间的字符,依旧是1个字节代表1个字符。Unicode(UTF-16)编码则所有字符都用2个字节表示。

你可能感兴趣的:(Go)