[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB

编码进化

回忆上次内容

  • 上次 回顾了 字符大战的结果

    • ibm 曾经的 EBCDIC 由于字符不连续的隐患

      • 导致后续 出现 无数问题
      • 无法补救
  • 7-bit 的 ASA X3.4-1963

    • 字母序号连续

      • 比较字符时 效率高
      • 判断字符 是否是字母 也很容易
    • 获得了 IBM以外公司的 支持

图片描述

  • 为什么 ASA X3.4-1963 是 7-bit 编码?

    • 8-bit 不是才 正好一个字节 吗?

ASA X3.4-1963 文档

  • 注意这篇文档

    • 通篇提到6-bit、7-bit
  • 但是

    • 没有提到Byte

图片描述

  • 那时候

    • 还有没有 Byte这个词

bite

  • 1956年

    • ibm工程师 Werner Buchholz
    • 第一次 使用了bite 来描述8-bit
    • 开音节读作[bait]

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第1张图片

  • bite 在1956年 太过超前

时代

  • 毕竟 当时的计算机

    • 还处于 从模拟 到数字 的过程中
  • 计算机的 输出设备是

    • 指示灯
    • 电压表
    • 示波器

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第2张图片

  • bite这个词

    • 流传于Rand、 MIT、IBM
  • 为了 和bit 区分

    • bite 的拼写

      • 演化成 Byte

ASA X3.4-1963 发布

  • IBM 编码演化

    • BCD码 4-bit

      • 发展到BCDIC 6-bit

        • 包含了字符
  • 网络通信 让 计算机 不再是 孤岛

    • IBM之外的其他公司 想要统一通信标准

      • 到 7-bit的 ASA X3.4-1963

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第3张图片

  • IBM 之外的公司 从产品层面跟进

    • IBM 想要 主导标准

词汇出现

  • 1964年

    • ibm 发布 System/360
    • 存储容量单位 为 Byte (8-bit)

      • 首款机型 4096 Byte

  • Byte 这个单词

    • 作为 营销话语中的 概念
    • 开始传播

孤注一掷

  • 为了配合 8-bit 的 System/360

    • 编码规则 从6-bit的 BCDIC

      • 直接跳到 8-bit的 EBCDIC

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第4张图片

  • 这是 IBM最后的倔强

终局

  • 两年之后 1965年

    • ibm最新机器

      • 也开始 使用 ASA X3.4-1963
      • 编码统一到了 7-bit的 ASA X3.4-1963

        • 也就是 后来的ASCII
        • 字符编码大战尘埃落定

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第5张图片

  • 可是为什么 ASCII编码 用 7-bit

    • 1个字节 却要 8-bit 呢?

      • 7-bit 不是 刚好放下 吗?

1个字节8位

  • 我们 来看看 Bemer的个人网站
  • 介绍 字符编码 进化过程

    • 5-bit的博多码
    • 6-bit的BCDIC
    • 7-bit的ASCII
    • 8-bit的EBCDIC

  • 为什么 字节是 8-bit

    • 而不是 7-bit 呢?
  • Bemer 的说法是

    • 2次幂的 魔法
    • 8 = 23

2次幂的魔法

  • 计算机 只有 两根手指
  • 每根 手指

    • 可以代表 (10)2进制种状态

图片描述

  • 就像 电路 只有

图片描述

  • 电灯 只有

手指 增多

  • (10)2进制根手指

    • 2根手指

      • 可以 代表(100)2进制种状态

        • 4种状态

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第6张图片

  • 这就是 2-4 译码器(decoder)
  • 如果 有更多手指 呢?

3-8 译码器

  • (11)2进制根手指

    • 3根手指

      • 可以代表 (1000)2进制种状态

        • 8种状态
  • 这就是 3-8译码器(decoder)

    • 或者说是 3-8解码器

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第7张图片

  • 再往后呢?

4-bit 寻址空间

  • (100)2进制根手指

    • 4根手指

      • 可以代表(10000)2进制种状态

        • 16种状态

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第8张图片

  • 再往上呢?

8-bit 寻址空间

  • 从4-bit 直接跳到 8-bit

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第9张图片

  • (1000)2进制根手指

    • 8根手指

      • 可以代表(100000000)2进制种状态

        • 256种状态
  • 8-bit的cpu

    • 直接寻址空间 可达256个Byte
  • 16-bit的寄存器

    • 直接寻址空间 64 x 1024 Byte

      • 相当于 64KByte
  • 随着 计算机字长的增加

    • 存储单位 在指数级增长

更多存储单位

  • 1 KB = 1024 Byte
  • 1 GB = 1024 KB
  • 1 TB = 1024 GB

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第10张图片

  • 这都是 基于Byte的单位
  • Byte 就是 8-bit
  • 但是7-bit的ASCII字符

    • 怎么放入 8-bit 的 Byte呢?

8-bit

  • ascii 的位置

    • ascii大小写字母之间只差 1 位(bit)
  • 最前面的 1-bit

    • 是 标志位
  • 后面的 7-bit

    • 是 ascii 字符数值

[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB_第11张图片

  • 如果 标志位 是0

    • 那么 这个字符 就是ascii字符
  • ascii的字符范围

    • 0 - 127
  • ASA X3.4-1963 就这样

    • 成了 ASA X3.4-1965

总结

  • 这次 回顾了 计算机存储单位的演变

    • 最小的读写单位 是 bit
  • 8-bit 固定下来 成为了字节(Byte)
位数 容量
8-bit 1Byte
1024Byte 1 KB
1024 KB 1 MB
1024 MB 1 GB
1024 GB 1 TB

你可能感兴趣的:(python)