[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化
中文系统bgk
回忆上次内容
- 汉字字形通过
- 点阵式打字机
- 像素级寻址的屏幕
- 进入了计算机的世界
- 在海峡对岸的台湾同胞
- 他们会使用GB2312编码吗?
中国台湾
-
BIG5 码
-
收录次序 取决于 频率
-
同时用 BIG5 编码和解码也是没有问题的
- 但如果用BIG5编码
- 却用gb2312解码就会有问题
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第1张图片](http://img.e-com-net.com/image/info8/f78420a60ca54fcd957d66c65c2908f5.jpg)
- 不过存储的内容在文件里
- 系统不知道用什么解码时
- 默认自动会用 gb2312 解码
- 这就造成了自动乱码
反之亦然
- 我们用 gb2312 编码的文字
- 用 gb2312 可以打开
- 但是用 BIG5 打开就是乱码
- 也需要转化
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第2张图片](http://img.e-com-net.com/image/info8/b4b8cc6b828740e6881c3f8c92ecffa3.jpg)
- 转化工具是有的
- 能解决问题但很麻烦
- 大量的输入输出编码解码的问题
- 令人头大

解决办法
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第3张图片](http://img.e-com-net.com/image/info8/6a5e412e9a404800ab6d1534e2bfe502.jpg)
-
当时如果日文游戏或者台湾地区的游戏不能玩
- 可能是因为字符编码格式不一致
- 可以用南极星调整字符编码格式
- 把不同编码格式进行转化
- 把字节按照正确的方式进行解码
- 就可以玩啦
-
没有个标准整合一下吗?
GBK
- GBK 即汉字内码扩展规范
- 在GB2312的基础上扩展了繁体字符集
- K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母
- 英文全称 Chinese Internal Code Specification
- 最初是微软搞的
- 虽然不是国家标准
- 却是事实上的技术规范
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第4张图片](http://img.e-com-net.com/image/info8/6e7d95e77db341699f2dabb0dd1c8365.jpg)
- 共收入 21886 个汉字和图形符号
- GB 2312 中的全部汉字、非汉字符号
- BIG5 中的全部汉字(繁体兼容 GBK1)
- 将 汉字、日本汉字、朝鲜汉字融合了
- 合计 20902 个汉字
- 标准并不是一蹴而就的
标准的烟花
-
GB也在不断进化
-
从GB2312-1986
-
但是还是有问题
-
GBK虽然兼容了BIG5 中的全部汉字
问题
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第5张图片](http://img.e-com-net.com/image/info8/bcac32ba2ffe4cc890c3e34ff60d8910.jpg)
推荐一款 点阵字库
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第6张图片](http://img.e-com-net.com/image/info8/c2b4788cf06b427b9657603df61ebac7.jpg)
字体辨识度
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第7张图片](http://img.e-com-net.com/image/info8/820e59f2b0734bd682b7bae638a16e74.jpg)
字体样式
中文隶书
终端时代的中文超文本编辑器
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第8张图片](http://img.e-com-net.com/image/info8/41aa593041444f88adb48167fbf6e2e9.jpg)
wps
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第9张图片](http://img.e-com-net.com/image/info8/935445fb3b64434f94d8a878c18c0c23.jpg)
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第10张图片](http://img.e-com-net.com/image/info8/b857988cc7bb4a789c3898d92eecb7f9.jpg)
中文之星
总结
- 中国的简体和繁体汉字
- 如果有一种编码 将所有的字符都能编进去就好了
- 中日韩(CJK)
- 简体繁体
- 欧洲各种拼音
- 梵文
- 阿拉伯文
- 等等等都包括进去
![[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第11张图片](http://img.e-com-net.com/image/info8/de3a477f0e7843bd90fe9f9247c8f111.jpg)
-
能有么?
-
我们下次再说!
-
蓝桥->https://www.lanqiao.cn/courses/3584
-
github->https://github.com/overmind1980/oeasy-python-tutorial
-
gitee->https://gitee.com/overmind1980/oeasypython