python入门回顾
1.列表是什么?
列表是PYTHON中的一种组合数据类型
2.什么时候用?
需要在一个变量中统一整理存储多个可以重复数据的情况下
3.为什么要用?
列表可以统一管理多个数据
4.如何使用?
声明 数据处理:增删改查[遍历]
insert/append/extend
pop/remove/clear
tips:
列表的使用缺陷:列表中直接存储数据,但是如果列表中的数据较多的话,可能会比较消耗内存【列表数据项较多、内存消耗较多】
针对列表的使用缺陷特征,我们可能会有以下疑问。
问题1:列表数据较多?怎么添加?
问题2:列表数据消耗内存较多?怎么优化?
接下来我们来通过三个名词来探寻解决问题之道。
1.列表推导式
一般情况下,如果一个列表中要存储大量相关数据,这些数据通常都是有规律的。
[如果列表中存储的数据量并不是很大,数据之间的关联关系可能并不是很大]
[如果列表中存储的数据量非常大,数据之间的关联关系非常强]
列表中的数据如果一旦存在指定的规律[简单->复杂],
通过指定的规则就可以自动推到存储列表对象,列表中的数据可以直接产生——列表推导式
列表推导式:程序表达式:可以运算的程序代码
基本推导式:得到一个0~100的自然数序列列表
[1] 手工创建添加数据
纯手工输入,不推荐。[2] 循环语法添加[可读性较高,代码较多]
# 常规方式
nums2 = list()
for i in range(0, 100):
nums.append(i)
print(nums)
打印结果为:[0, 1, 2, 3, ... ,100]
- [3] 推导式操作:推荐
nums3 = [x for x in range(0, 100)]
print(nums)
打印结果为:[0, 1, 2, 3, ... ,100]
eg:
有一个班级的学生的成绩,求所有大于平均成绩的成绩名单。*
# 常规操作
score = [20, 50, 69, 70, 99, 145, 149]
average1 = sum(score)/len(score)
score1 = list()
for s in score:
if s >= avg:
score1.append(s)
print(score1)
打印结果为:[99, 145, 149]
# 列表推导式简化
score = [20, 50, 69, 70, 99, 145, 149]
score2 = [s for s in score if s >= sum(score)/len(score)]
print(score2)
打印结果为:[99, 145, 149]
列表推导式通过表达式定义的规则,可以在一个表达式中给列表增加指定规则的元素
2.列表生成器
生成器:在使用过程中,根据指定的规则运算产生列表元素数据
使用过程:运行时
运算产生:规则 == 推导式
生成器和推导式区别:
推导式: 使用列表的运行前 得到完整列表
生成器: 使用列表 运行时 得到下一个列表元素
生成器:推导式->将推导式的语法方括号->修改成圆括号
推导式->列表[list]->包含具体元素数据->索引/下标-获取数据
数据量较大:运算消耗时间消耗内存
生成器->对象[generator]->包含运算规则->next()
/next()-获取数据与数据量大小无关
from memory_profiler import profile
'''
使用推导式计算数据量大的数如:10**5
tips1: 推导式会一次性读取列表内所有数据
tips2:一般电脑(4-6G内存)会出现卡顿,表明此时计算机计算的数据过大
小编的笔记本电脑为6G内存,证实有出现了卡顿现象。如配置较低,可将5改为4或者3即可。
'''
@profile
def main():
# 推导式
num1 = [x for x in range(10, 10**5)]
return num1
if __name__ == "__main__":
num1 = main()
打印结果为:
Line # Mem usage Increment Line Contents
================================================
4 16.3 MiB 16.3 MiB @profile
5 def main():
6 # 推导式
7 16.7 MiB 0.4 MiB num1 = [x for x in range(10, 10**4)]
8 16.7 MiB 0.0 MiB return num1
from memory_profiler import profile
'''
列表生成器(优化内存分配)
tips:
'''
@profile
def main():
# 生成器
num1 = (x for x in range(10, 10**4))
return num1
if __name__ == "__main__":
num1 = main()
print(type(num1))
打印结果为:
Line # Mem usage Increment Line Contents
================================================
4 16.3 MiB 16.3 MiB @profile
5 def main():
6 # # 推导式
7 # num1 = [x for x in range(10, 10**4)]
8 # return num1
9 # 生成器
10 16.3 MiB 0.0 MiB num1 = (x for x in range(10, 10**4))
11 16.3 MiB 0.0 MiB return num1
生成器的使用注意事项:
1.如果是项目中的对象数据使用,要存储到列表中->跟生成器/推导式 无关
列表->作用:只是一个临时存储多个数据的小容器
2.项目中定义固定规则的数据列表用来参与业务运算:生成器/推导式
项目开发中,定义验证码字符
3.项目中的核心算法使用到大量有规则的数据:生成器
核心模块中开发数据算法:生成器-技术层面的数学算法开发
核心模块中的算法改造:生成器- 技术+业务 完成的算法修改
3.迭代器
列表、推导式、生成器 -> 都是通过 for循环遍历完成数据处理的
简述生成器和迭代器的区别与联系?
1.生成器主要是定义了一个数据的生成规则,通过运行时算法得到类似列表数据的一种特殊对象
2.迭代器是用于循环遍历可迭代数据的一个特殊对象,包含了迭代对象和迭代过程
3.联系:生成器对象就是一种可迭代对象,可以被迭代器遍历。