第二章 python基础
1、数据类型和变量
(1)数据类型:整数、浮点数、字符串、转义字符、布尔值、空值
(2)变量与常量
2、字符串和编码
字符编码
1 byte = 8 bit,最大表示数字255,也就是11111111。首先是Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。本着节约的精神,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。
python的字符串
(1)ord('A')可以获取字符的整数表示,chr(66)可以获取编码的对应字符。
(2)Python的字符串类型是str,Python对bytes类型的数据,用带b前缀的单引号或双引号表示:b'ABC'。要把bytes变为str,就需要用decode()方法。
(3)len()函数计算的是str的字符数,如果换成bytes,len()函数就计算字节数。
格式化
在Python中,采用的格式化方式和C语言是一致的,用%实现,举例如下:
3、list和tuple
list
(1)list是一种有序的集合,可以随时添加和删除其中的元素。比如:classmates = ['Michael','Bob','Tracy']
可以用索引来访问某一个元素,也可以插入,删除,替换。类似于C语言的数组。
(2)list元素也可以是另一个list,比如:
>>> p = ['asp','php']
>>> s = ['python','java', p,'scheme']
要拿到'php'可以写p[1]或者s[2][1],因此s可以看成是一个二维数组。
tuple
(1)一种有序列表叫元组:tuple。tuple和list非常类似,但是tuple一旦初始化就不能修改,更加安全,比如:>>> classmates = ('Michael','Bob','Tracy')
(2)只有1个元素的tuple定义时必须加一个逗号,,来消除歧义,比如:>>> t = (1,)
(3)tuple不可变,但是list的元素是可变的,二者的组合如下:
>>> t = ('a','b', ['A','B'])
>>> t[2][0] ='X'
>>> t[2][1] ='Y'
>>> t('a','b', ['X','Y'])
问题讨论
根据楼主的tuple学习,做了些练习,发现下面的写法,t里面的list变量没有被重新赋值,请问是为什么呢?
一、定义: list = ['A','B',] t = ('a','b',list)
二、重新赋值给list: list = ['X','Y']
三、执行t,输出为还是: ('a', 'b', ['A', 'B'])
答:关键在于变量的指向问题。第一步完成后,变量list指向一个集合,t指向一个元组,元组的第三个元素指向了list指向的集合,第二步完成后,变量list指向了另一个集合,此时输出t当然没变。
(1)第二步以后,再执行t = ('a','b',list),将变量t重新指向;
(2)不是改变list的指向,而是改变之前集合里的元素,比如list[0]='X',或者 t[2][0] ='X'。
4、条件判断
5、循环
(1)for...in循环,依次把list或tuple中的每个元素迭代出来,所以for x in ...循环就是把每个元素代入变量x,然后执行缩进块的语句。比如:
for x in [1,2,3,4,5,6,7,8,9,10]:
sum = sum + x
(2)range()函数,可以生成一个整数序列,再通过list()函数可以转换为list。比如range(5)生成的序列是从0开始小于5的整数。比如:
>>>list(range(5))
[0, 1, 2, 3, 4]
(3)break可以中断循环,continue可以跳过循环。
6、dic和set
dic
Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。比如:>>> d = {'Michael':95,'Bob':75,'Tracy':85}
(1)判断key是否存在:
>>> 'Thomas' in d
或者
>>> d.get('Thomas', -1)
(2)删除一个key,用pop(key)方法,对应的value也会从dict中删除:
>>> d.pop('Bob')
(3)和list比较,dict有以下两个特点:查找和插入的速度极快,不会随着key的增加而变慢;
需要占用大量的内存,内存浪费多。所以,dict是用空间来换取时间的一种方法。
(4)dict的key必须是不可变对象,通过key计算位置的算法称为哈希算法(Hash)。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。而list是可变的,就不能作为key。
set
set和dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key。要创建一个set,需要提供一个list作为输入集合。比如:
>>> s = set([1,1,2,2,3,3])
(1)通过add(key)方法可以添加元素到set中,可以重复添加,但不会有效果:
(2)通过remove(key)方法可以删除元素:
不可变对象
前面提到了字符串、整数、浮点数等都是不可变的。比如:
>>> a ='abc' #建立一个字符串abc,然后用变量a指向该字符串。
>>> a.replace('a','A') #建立一个新的字符串Abc,然后让变量a重新指向新的字符串。