编码字符 - \u后面跟4位的十六进制数，来表示一个字符。这个4位的16进制数对应的值是字符的编码值
十六进制：0123456789ABCDEF 或者0123456789abcdefg
str3 = 'abc+\u4e00'
print(str3)

字符编码

python中的字符采用的是Unicode编码
计算机存储数据的时候只能存数据，而且存的是数字的补码（是以2进制的格式进行储存的）
100 # 十进制数
print(bin(100)) # bin(数字) - 获取指定数字的二进制
print('二进制：',0b1100100)
print(oct(100),0o144) # oct(数字) - 获得指定数值的八进制
print(hex(100),0x64) # hex(数字) - 获得指定数字的十六进制
print(0b1100100*10)

编码

编码：每个字符在计算机中存储的时候都会对应一个固定唯一的数字，这个数字就是这个字符的编码。
每一个字符和数字的一一对应关系就编码表，常见的编码表有：ASCII编码表和Unicode编码表
ASCII码表只对数字字符、字母字符。英文符号进行编码
Unicode编码表是对ASCII表的扩充，能够对世界上所有的符号进行编码:4e00到9fa5(汉字范围)

chr(编码值) - 获取编码值对应的字符

num = 0
for code in range(0x4e00,0x9fa5):
print(chr(code),end=' ')
num += 1
if num % 20 ==0:
print()
print(num)

ord(字符) - 获取字符对应的编码值

print(ord('曹'),ord('琦'))
print(chr(26361),chr(29734))

str3 = '\u4fff\u5faa\u00c8'
print(str3)

print(hex(200))
print('a' > 'Z')
print('曹' > '琦')

获取字符串的字符

str1 = 'py\nthon'
print(str1[4])
运行结果为 h \n算一个字符

获取单个字符，下标不能越界
获取多个字符，下标可以越界

切片的语法中可以对步长、开始下标和结束下标进行省内：
1.省略步长(步长默认为1)
字符串[开始下标:结束下标] == 字符串[开始下标:结束下标:1]
2.省略下标
字符串[;结束下标:步长] - 如果步长是正，从字符串开头往后取；如步长为负，从字符串最后一个字符串往前取
字符串[开始下标::步长] - 如果步长为正，取到最后一个字符为止；如果步长为负，取到第一个字符为止

遍历字符串 - 一个一个的取出所有的字符

方法一;直接遍历
for 变量 in 字符串:
循环体
方法二:通过遍历下标，来遍历字符串
for 变量 in range(字符串长度):
字符串[变量]
for char in 'hello':
print(char)

len(字符串) - 获取字符串长度，返回一个数字。字符串长度指的是字符串中字符的个数

str3 = 'when i was young'
for index in range(len(str3)):
    print(index,str3[index])

index = 0
while index < len(str3):
    print(index,str3[index])
    index += 1

2019-03-12