拉丁字符
回忆上次内容
- 上次回顾了字型编码的进化过程
- 7-bit 的 点阵字库
- 终于让 字母、数字、标点 明确了字型
- 但是 7-bit 的 ascii中
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第1张图片](http://img.e-com-net.com/image/info8/b26284e362024b729971f5f5f1d5ec6c.jpg)
- 如果扩展位为1
- 这噩梦
- 比法语不兼容 更可怕!
- 这以后 编码就越来越多了
- 互认对方为乱码
- 法文字符
- 这可怎么办呢?
那可是法国啊!
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第2张图片](http://img.e-com-net.com/image/info8/fa666f67fcf0450f9d19af5670be9ce2.jpg)
- 美国 从英国独立 最早靠的
- 还是 富兰克林来法国
- 现在美国字符集ascii里面
- 伤心的法国人 不由得回忆起那场海战
特拉法尔加海战
- 如果当年法国拿破仑选用富尔顿的火轮船
- 如果 结局改写
- 英国应该 无法和法国 在海上争霸
- 最终 世界语言是法语
- 美国 入学考的不是TOEFL
- 而是 TOFFL
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第3张图片](http://img.e-com-net.com/image/info8/0ec3056c1c6a48aebcefa2cc5121fe3b.jpg)
征服者威廉
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第4张图片](http://img.e-com-net.com/image/info8/a9551c0dc2144217b6494e9ed12a64a5.jpg)
- 不列颠岛 北高南低
- 挡住北边的冷风
- 非常 适合生存
- 从来就 不乏 征服者
英伦
- 伊比利亚、凯尔特、罗马、昂撒、丹麦、法国诺曼都曾征服不列颠
- 英格兰岛的名字 来自于 盎格鲁部落
- 当时昂撒 是 凯尔特人 搬来的救兵
- 假途灭虢 占了这个南方平坦的宝岛
- 说 这是我们盎格鲁人的岛
- 盎格鲁岛人说的语言
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第5张图片](http://img.e-com-net.com/image/info8/f58eb7fb622042f08502e113178a4b41.jpg)
- 英国的文化 本就是 多民族、宗教杂糅出来的一个混合体
- 从不希望 欧洲大陆出现强大的帝国
- 那就会 威胁到岛上的安全
- 英国对于 欧洲各国制衡之术
- 不过说到底 所有文化的开局 都是从非洲走出来的
- 但是 电子信息化到数字化 是一个新的大环境
- 先回顾 ASCII的基本情况
ascii
- 目前最熟悉的编码是
ascii
编码
- 字节中 第
1
位 为 0
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第6张图片](http://img.e-com-net.com/image/info8/9435ffd16fd146a8993994b61f025bb8.png)
尝试输出
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第7张图片](http://img.e-com-net.com/image/info8/8944f826f99547d9bc2d3bc2277b6b1a.jpg)
闭环
- 这规律
- 和ascii 一样的
- 也就是说 这个字节里面除了 ascii 的 128 个字符之外
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第8张图片](http://img.e-com-net.com/image/info8/12325d0bbae44f23bf0fca4fdb4a5889.jpg)
编码格式
机皇的影响力
- 新的终端
- 就必须兼容VT100
- 包括VT100中 一项新功能
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第9张图片](http://img.e-com-net.com/image/info8/07e170d1315f46eba6f3636bd3d5ede4.jpg)
事实上的标准
- VT100 是当时 最流行的终端
- 不但支持 常用的转义字符
- 还创造出 VT100控制码
\033[0m // 关闭所有属性
\033[1m // 设置为高亮
\033[4m // 下划线
\033[5m // 闪烁
\033[7m // 反显
\033[8m // 消隐
\033[nA // 光标上移 n 行
\033[nB // 光标下移 n 行
\033[nC // 光标右移 n 行
\033[nD // 光标左移 n 行
\033[y;xH // 设置光标位置
\033[2J // 清屏
- 这就是 后来CSI的雏形
- Control Sequence Introducer
- 有了这个 就可以控制
- 慢慢 DEC的VT100标准
ISO组织
- 总部在 瑞士日内瓦湖的 ISO组织
- 负责 跨国跨公司的标准化
- 在Dec所用 编码格式的基础 上
- 为什么 选择Dec的 编码格式?
- 因为 VT100是 当时的 一代机皇
- 用户数量 就是 事实上的标准
- 根据 dec公司的 字符集
- 前一半(0-127)
- 后一半(128-255)
- 这个 编码
- 叫做 iso-8859-1
- 也叫做 latin-1
- latin-1覆盖的 范围如何呢?
覆盖范围
- 西欧北欧语族都可以覆盖到
- 拉丁人的罗曼语族(法意西葡)
- 日耳曼人的日耳曼语族(瑞丹挪德冰)
- 凯尔特人的盖尔语族(苏爱)
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第10张图片](http://img.e-com-net.com/image/info8/2ca855615b024abcbcb7530a8462b7ae.jpg)
latin-1
![[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin_第11张图片](http://img.e-com-net.com/image/info8/3261577022df4a73b03f4abfc5896d01.jpg)
- 北欧 这么多国家
- 北欧 不是有 自己的一套符文系统吗?
总结
- 这次回顾了 非ascii的拉丁字符编码的进化过程
- 西欧、北欧语言 大多使用 拉丁字符
-
北欧 原来 不是有自己的卢恩文字(Runes)符文系统吗?
-
我们下次再说!
-
蓝桥->https://www.lanqiao.cn/courses/3584
-
github->https://github.com/overmind1980/oeasy-python-tutorial
-
gitee->https://gitee.com/overmind1980/oeasypython