2019-03-12

编码字符 - \u后面跟4位的十六进制数,来表示一个字符。这个4位的16进制数对应的值是字符的编码值
十六进制:0123456789ABCDEF 或者0123456789abcdefg
str3 = 'abc+\u4e00'
print(str3)

字符编码

python中的字符采用的是Unicode编码
计算机存储数据的时候只能存数据,而且存的是数字的补码(是以2进制的格式进行储存的)
100 # 十进制数
print(bin(100)) # bin(数字) - 获取指定数字的二进制
print('二进制:',0b1100100)
print(oct(100),0o144) # oct(数字) - 获得指定数值的八进制
print(hex(100),0x64) # hex(数字) - 获得指定数字的十六进制
print(0b1100100*10)

编码

编码:每个字符在计算机中存储的时候都会对应一个固定唯一的数字,这个数字就是这个字符的编码。
每一个字符和数字的一一对应关系就编码表,常见的编码表有:ASCII编码表和Unicode编码表
ASCII码表只对数字字符、字母字符。英文符号进行编码
Unicode编码表是对ASCII表的扩充,能够对世界上所有的符号进行编码:4e00到9fa5(汉字范围)

chr(编码值) - 获取编码值对应的字符

num = 0
for code in range(0x4e00,0x9fa5):
print(chr(code),end=' ')
num += 1
if num % 20 ==0:
print()
print(num)

ord(字符) - 获取字符对应的编码值

print(ord('曹'),ord('琦'))
print(chr(26361),chr(29734))

str3 = '\u4fff\u5faa\u00c8'
print(str3)

print(hex(200))
print('a' > 'Z')
print('曹' > '琦')

获取字符串的字符

str1 = 'py\nthon'
print(str1[4])
运行结果为 h \n算一个字符

获取单个字符,下标不能越界
获取多个字符,下标可以越界

切片的语法中可以对步长、开始下标和结束下标进行省内:
1.省略步长(步长默认为1)
字符串[开始下标:结束下标] == 字符串[开始下标:结束下标:1]
2.省略下标
字符串[;结束下标:步长] - 如果步长是正,从字符串开头往后取;如步长为负,从字符串最后一个字符串往前取
字符串[开始下标::步长] - 如果步长为正,取到最后一个字符为止;如果步长为负,取到第一个字符为止

遍历字符串 - 一个一个的取出所有的字符

方法一;直接遍历
for 变量 in 字符串:
循环体
方法二:通过遍历下标,来遍历字符串
for 变量 in range(字符串长度):
字符串[变量]
for char in 'hello':
print(char)

len(字符串) - 获取字符串长度,返回一个数字。字符串长度指的是字符串中字符的个数

str3 = 'when i was young'
for index in range(len(str3)):
    print(index,str3[index])

index = 0
while index < len(str3):
    print(index,str3[index])
    index += 1

你可能感兴趣的:(2019-03-12)