编码的发展过程:

美国ASCII码:1个字节

     ↓

各国编码,如中国GB2312编码:2个字节

    

统一编码:Unicode 通常为2个字节,字节固定,浪费

    

UTF-8:将Unicode的字节 自动缩减合适字节存储,字母为1个字节,普通汉字为3个字节


字符 ASCII Unicode UTF-8
A 01000001 00000000 01000001 01000001
01001110 00101101 11100100 10111000 10101101

此表格参考:https://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001386819196283586a37629844456ca7e5a7faa9b94ee8000


ASCII字符与数字转换:

#!/usr/bin/python

a = 65;
print ord('a'); #字符转数字
print chr(a);   #数字转字符

符数转换.PNG


汉字字符输出:

#!/usr/bin/python
# -*- coding: utf-8 -*-   ##告诉Python解释器,按照UTF-8编码读取源代码

print u'文';  #u'...' 用unicode编码字符输出

u.PNG