Effective Python 学习笔记 2

Effective Python 学习笔记 2

用列表推导来取代map和filter

列表推导(list commprehension):根据一份列表来制作另外一份列表

    '''
        用列表每个元素平方值构建另一份列表
        a = [1, 2, 3, 4, 5, 6, 7, 8]
    '''
    # 列表推导写法
    squares = [x ** 2 for x in a]
    # map写法
    squares = map(lamda x: x ** 2, a)

    # 条件输出
    # 列表推导输出偶数
    squares = [x for x in a if a%2 == 0]
    # map辅以filter输出偶数
    squares = map(lambda x: x, filter(lambda x: x % 2 == 0, a))
    字典与集也有类似的推导机制,编写算法时,可以通过这些推导机制来创建衍生的数据结构。
    chile_ranks = {'ghost': 1, 'god': 2, 'man': 3}
    rank_dict = {rank: name for name,rank in chile_ranks.items()}
    chile_len_set = {len(name) for name in rank_dict.values()}
    print(rank_dict)
    print(chile_len_set)

    #元组与dict互转
    tuple = dict.items()
    dict = tuple.values

注意

  1. 不使用含有两个以上表达式的列表推导,难理解尽量避免
  2. 列表推导支持多级循环,每一级循环也支持多项条件

缺点

  1. 数据量较少时,不会出现问题,数据量较多时可能会耗费大量内存

用生成器表达式来改写数据量较大的列表推导

什么是生成器

    通过列表生成式,我们可以直接创建一个列表,但是,受到内存限制,列表容量肯定是有限的,而且创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
    所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间,在Python中,这种一边循环一边计算的机制,称为生成器:generator。
    '''
        eg. 读取日志文件
    '''
    it = (len(x) for x in open('/var/log.log'))
    print(it)
    >>>  at 0x101b81480
    print(next(it))
    >>> "logs"

要点

  1. 当输入数据量较大时,列表推导可能会因为占用太多内存而出现问题
  2. 由生成器表达式返回的迭代器,可以逐次产生输出值,从而避免内存用量问题
  3. 把某个生成器表达式所返回的迭代器,放在另一个生成器表达式的for子表达式中,即可将二者结合起来
    a = [1, 2, 3, 4, 5, 6]
    res = ((x, x ** 2) for x in a)
  1. 串在一起的生成器表达式执行速度很快

尽量用enumerate取代range

    '''
        场景说明:当想同时打印元素在列表中的索引和值的时候,使用range略显生硬
    '''
    # range写法
    for i range(len(list)):
        value = list[i]
        index = i
    # enumerate写法
    for i, value in enumerate(list):
        print('%d: %s' % (i + 1, value))

要点

  1. 尽量使用enumerate来改写那种将range与下标访问结合的序列遍历代码
  2. 可以给enumerate提供第二个参数, 以指定开始计数时所用的值

用zip函数同时遍历两个迭代器

zip可以将两个或者多个迭代器封装成一个生成器

    '''
        场景说明:需要平行对两个列表进行操作时
    '''
    names = ['alice', 'bob', 'cendy']
    letters = [len(n) for n in names]

    longest_name = None
    max_letters = 0

    for name, count in zip(names, letters):
        if count > max_letters:
            longest_name = name
            max_letters = count
    print(longest_name)

要点

  1. 内置的zip函数可以平行地遍历多个迭代器
  2. python3中的zip函数相当于生成器,会在遍历过程中产生元组
  3. 如果提供的迭代器长度不等,那么zip会自动提前终止
  4. itertools内置模块中的zip_longest函数可以平行的遍历多个迭代器,而不用在乎他们的长度是否相等

你可能感兴趣的:(Effective Python 学习笔记 2)