python学习笔记(二)

今天学习python的字符串与编码。

字符串或串(String)是由数字、字母、下划线组成的一串字符。

对于单个字符的编码,python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符:

输入:ord(‘A’)    ord(‘中’)        chr(66)      chr(25991)

输出:65            20013           ‘B’             '文'

python的字符串类型是str,在内存中以Unicode表示,一个字符对应若干个字节。若要在网络上传输,或者保存到磁盘上,就需要把str变为以字节单位的bytes。

python对bytes类型的数据用带b前缀的单引号或双引号表示:

x=b' ABC'

要计算str包含多少个字符,可以用len()函数:

输入: len('ABC')       len(‘中文’)            len(b'\xe4\xb8\xe6\x96\x87)            len(‘中文’.encode(‘utf-8’))
输出: 3                      2                           6                                                     6

1个中文字符经过UTF-8编码后悔占用3个字节,而1个英文字符只占用1个字节。




你可能感兴趣的:(python编程,字符串,编码,Python学习)