[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化

中文系统bgk

回忆上次内容

  • 汉字字形通过
    • 点阵式打字机
    • 像素级寻址的屏幕
    • 进入了计算机的世界

  • 在海峡对岸的台湾同胞
    • 也进入了汉字时代
  • 他们会使用GB2312编码吗?
    • 能互通吗?

中国台湾

  • BIG5 码

    • 是由 5 个公司联合制作的
  • 收录次序 取决于 频率

    • 然后是 笔画数
    • 然后是 康熙字典
  • 同时用 BIG5 编码和解码也是没有问题的

    • 但如果用BIG5编码
    • 却用gb2312解码就会有问题

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第1张图片

  • 不过存储的内容在文件里
    • 系统不知道用什么解码时
    • 默认自动会用 gb2312 解码
    • 这就造成了自动乱码

反之亦然

  • 我们用 gb2312 编码的文字
    • 用 gb2312 可以打开
    • 但是用 BIG5 打开就是乱码
    • 也需要转化

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第2张图片

  • 转化工具是有的
    • 能解决问题但很麻烦
    • 大量的输入输出编码解码的问题
    • 令人头大

图片描述

  • 确实麻烦

解决办法

  • 麻烦的地方正是机会所在

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第3张图片

  • 当时如果日文游戏或者台湾地区的游戏不能玩

    • 可能是因为字符编码格式不一致
    • 可以用南极星调整字符编码格式
    • 把不同编码格式进行转化
    • 把字节按照正确的方式进行解码
    • 就可以玩啦
  • 没有个标准整合一下吗?

GBK

  • GBK 即汉字内码扩展规范
    • 在GB2312的基础上扩展了繁体字符集
    • K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母
    • 英文全称 Chinese Internal Code Specification
    • 最初是微软搞的
    • 虽然不是国家标准
    • 却是事实上的技术规范

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第4张图片

  • 共收入 21886 个汉字和图形符号
    • GB 2312 中的全部汉字、非汉字符号
    • BIG5 中的全部汉字(繁体兼容 GBK1)
    • 将 汉字、日本汉字、朝鲜汉字融合了
    • 合计 20902 个汉字
  • 标准并不是一蹴而就的

标准的烟花

  • 正如ASA X3.4-1963
    • 到 ASA X3.4-1965
      • 最终到ascii

  • GB也在不断进化

    • 从GB/T 1355-86
      • 到GB/T 1355-2021
        • 这是小麦粉标准的进化
  • 从GB2312-1986

    • 再到GBK
      • 这是中文字符标准的进化
  • 但是还是有问题

  • GBK虽然兼容了BIG5 中的全部汉字

    • 但是无法兼容编码
      • 用GBK打开BIG5编码的文件还是乱码

问题

  • 如果新GBK兼容了BIG5编码
    • 就无法向前兼容gb2312

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第5张图片

  • 这无解了吗?
    • 时间自会给我们答案
    • 老天自有安排!

推荐一款 点阵字库

  • 中文点阵
    • 最小也需要 7x7 像素

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第6张图片

  • 这个风格很独特

字体辨识度

  • 字体辨识度

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第7张图片

字体样式

  • 1994年的《魔兽争霸》
    • 像素字体在RGB显卡的支持下
      • 字体不但可以有衬线
        • 而且可以有立体感

  • 配色也很细腻

中文隶书

  • 智冠公司出品的《三国演义》

  • 使用隶书和车马符号
    • 代表那个三国时代

终端时代的中文超文本编辑器

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第8张图片

  • 当时的wps系统

wps

  • 当时还没有所见即所得

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第9张图片

  • 使用一些编辑标记
    • 制作富文本

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第10张图片

  • 只有打印预览才能查看效果

中文之星

  • 还可以做艺术字特效

总结

  • 中国的简体和繁体汉字
    • 字符数量都超级大
    • 彼此还认对方为乱码
  • 如果有一种编码 将所有的字符都能编进去就好了
    • 中日韩(CJK)
    • 简体繁体
    • 欧洲各种拼音
    • 梵文
    • 阿拉伯文
    • 等等等都包括进去

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化_第11张图片

  • 能有么?

  • 我们下次再说!

  • 蓝桥->https://www.lanqiao.cn/courses/3584

  • github->https://github.com/overmind1980/oeasy-python-tutorial

  • gitee->https://gitee.com/overmind1980/oeasypython

你可能感兴趣的:(java,前端,开发语言)