字符串

字符串

字符编码

字节:每个二进制位(bit)有0,1两种状态,八个二进制位组成一个字节(byte),共可以组成256种状态。

字符:各种文字及符号的总称
字符集:一个系统支持的所有抽象字符的集合

  • ASCLL字符集、GB2312字符集。。。。。。
  • 在字符集中,有一个码表的存在,每一个字符在各自的字符集中对应着唯一一个码。但是同一个字符在不同的字符集中对应的码是不一样的

字符编码:按照某种规则,将字符转化为计算机可以接收的二进制数(数字代码),即将字符存储在计算机中

  • 字符集和字符编码一般一一对应,比如GB18030既可以代表字符集,也可以代表对应的字符编码
  • 例外:Unicode字符集,他有多种编码实现(UTF-8,UTF-16,UTF-32等)

解码:将存储在计算机中的二进制数显示解析出来的过程

ASCLL:主要用于显示现代英语,使用7位表示一个字符,所以供128个字符。
ord():获取字符在ASCLL字符代码表中对应的十进制数
bin():将十进制转换成二进制

Unicode:计算机科学领域的标准
Unicode字符集规定了字符的二进制代码,但是没有规定二进制代码的存储方式

UTF-8:针对Unicode的可变长度字符编码,也是一种前缀码,根据不同的符号而变化字符长度。

字符串

创建字符串:一对单引号或双引号;一对三个单引号或双引号,支持换行;支持中文
字符串类型符号:str
转义符:“\”

字符串_第1张图片
转义符

字符串是序列,一个或多个元素按照一定顺序排列。所以元素的顺序是有意义的,而且可以根据元素的位置顺序进行编号,也就是索引。
字符串中的每个字符,对应两个索引编号。从左向右及从右向左。0开始或-1开始。
str[索引] 返回对应索引的字符
切片:依据字符串中的部分内容,生成新的字符串
str[s1(开始位置,可省略,从第一个开始):s2(结束位置,可省略,到最后一个结束):l(一次切多少,默认1,负值从右向左)] 包含开始,不包含结束

字符串_第2张图片
字符串切片

s = 'hello world'
s[::-1]
'dlrow olleh'

字符串反序

字符串的方法

连接两个字符串:+
重复字符串中的元素:*
测量字符串的长度:len() 每个汉字一个字符长度
判断某个字符是否存在与字符串中:in例如 str1 in str2 返回true或者false

isdigit():判断字符串是否由纯数字组成
split(str):通过规定字符串对目标字符串进行分割
join():str.join(strlist) 通过str将字符串列表连接起来

format():用于填充格式化数据占位符

'I like {0} and {1}'.format('python','java')
'I like python and java'

'I like {0:10} and {1:>15}'.format('python','java')
'I like python and java'

'I like {0:^10} and {1:>15}'.format('python','java')
'I like python and java'

format('hello', '->20')
'---------------hello'

format文档

你可能感兴趣的:(字符串)