python中的推导式(list,dict...)

  推导式(comprehensions):又称解析式,是python的一种独有特性,推导式可以从一个数据序列构建另一个新的数据序列的结构体,共有三种推导式,在python2和python3中都支持:
    列表(list)推导式
    字典(dict)推导式
    集合(set)推导式

一、列表推导式
  列表推导能非常简洁的构造一个新列表:只用一条简洁的表达式即可对得到的元素进行转换变形
  其基本格式如下:[expr for value in collection if condition]
  过滤条件可有可无,取决于实际应用,只留下表达式;相当于下面这段for循环:
    result = []  
    for value in collection:  
    if condition:  
        result.append(value)

  1、过滤掉长度小于3的字符串列表,并将剩下的转换成大写字母
    names = ['bob','tom','alice','jerry','wendy','smith']
    name1 = [name.upper() for name in names if len(name)>3]
    print(name1)                #['ALICE', 'JERRY', 'WENDY', 'SMITH']

  2、求(x,y)其中x是0-5之间的偶数,y是0-5之间的奇数组成的元祖列表
    li = [(x,y) for x in range(5) if x%2==0 for y in range(5) if y%2==1]
    print(li)               #[(0, 1), (0, 3), (2, 1), (2, 3), (4, 1), (4, 3)]

  3、求m中3,6,9组成的列表
    m = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
    [row[2] for row in m]              #[3,6,9]

  4、求m中斜线1,5,9组成的列表
    m = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
    [m[i][i] for i in range(len(m))]          #[1,5,9]

  5、求m,n中矩阵和元素的乘积
    m = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
    n = [[2, 2, 2], [3, 3, 3], [4, 4, 4]]
    [m[row][col]*n[row][col] for row in range(3) for col in range(3)]              #[2, 4, 6, 12, 15, 18, 28, 32, 36]
    或者:
    [[m[row][col]*n[row][col] for col in range(3)] for row in range(3)]            #[[2, 4, 6], [12, 15, 18], [28, 32, 36]]  
    或者:
    [[m[row][col]*n[row][col] for row in range(3)] for col in range(3)]         #[[2, 12, 28], [4, 15, 32], [6, 18, 36]]

  6、讲字典中age键,按照条件赋新值
    bob = {'pay': 3000, 'job': 'dev', 'age': 42, 'name': 'bob smith'}  
    sue = {'pay': 4000, 'job': 'hdw', 'age': 45, 'name': 'sue jones'}
    people = [bob, sue]  
    [rec['age']+100 if rec['age'] >= 45 else rec['age'] for rec in people]              # 注意for位置 [42, 145]    
 
  7、如下的列表推导式结合两个列表的元素,如果元素之间不相等的话:
    [(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]                  #[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

  8、列表推导式可使用复杂的表达式和嵌套函数:
    from math import pi   
    [str(round(pi, i)) for i in range(1, 6)]                          #['3.1', '3.14', '3.142', '3.1416', '3.14159']  

  9、列表推导式可以嵌套。
    考虑以下的 3x4 矩阵,一个列表中包含三个长度为4的列表:
    matrix = [[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12]]
    [[row[i] for row in matrix] for i in range(4)]                    #[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

    以上推导式也可以写作:
    n_num = []
    for i in range(4):
        n_row = []
        for row in matrix:
        n_row.append(row[i])
        n_num.append(n_row)
    print(n_num)


二、字典推导式
  字典和集合推导式是该思想的延续,语法差不多,只不过产生的是集合和字典而已。其基本格式如下:
  { key_expr: value_expr for value in collection if condition }
  strings = ['import','is','with','if','file','exception']
  d = {key: val for val,key in enumerate(strings)}                      # {'exception': 5, 'is': 1, 'file': 4, 'import': 0, 'with': 2, 'if': 3}


三、集合推导式
  集合推导式跟列表推导式非常相似,唯一区别在于用{}代替[]。其基本格式如下:
  { expr for value in collection if condition }
  用集合推导建字符串长度的集合
  strings = ['a','is','with','if','file','exception']  
  {len(s) for s in strings} #有长度相同的会只留一个,这在实际上也非常有用  
  set([1, 2, 4, 9])  


四、嵌套列表推导式
  嵌套列表是指列表中嵌套列表,比如说:
  ix = [[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12]]
 
  1、 一个由男人列表和女人列表组成的嵌套列表,取出姓名中带有两个以上字母e的姓名,组成列表
    names = [['tom','billy','jefferson','andrew','wesley','steven','joe'],['alice','jill','ana','wendy','jennifer','sherry','eva']]
    [name for lst in names for name in lst if name.count('e')>=2] #注意遍历顺序,这是实现的关键  ['jefferson', 'wesley', 'steven', 'jennifer']
    用for循环实现:
    tmp = []  
    for lst in names:  
        for name in lst:  
            if name.count('e') >= 2:  
            tmp.append(name)  
    print (tmp)

  2、找出质数    
    for循环实现:   
    noprimes = []
    for i in range(2, 8):
        for j in range(i*2, 50, i):
            noprimes.append(j)
    primes = []
    for x in range(2, 50):
        if x not in noprimes:
            primes.append(x)
    列表推导式:
    noprimes = [j for i in range(2, 8) for j in range(i*2, 50, i)]
    primes = [x for x in range(2, 50) if x not in noprimes]

    注:第一行代码在一个列表生成式里使用了多层for循环。第一个循环是外部循环,第二个循环是是内部循环。为了找到质数,我们首先找到一个非质数的列表。通过找出2-7的倍数来产生这个非质数 列表。然后我们循环遍历数字并查看每个数字是否在非质数列表。
    修正:正如reddit上的shoyer指出的,使用集合(set)来查找noprimes(代码里的属性参数,译者注)效率更高。由于noprimes应该只包含唯一的值,并且我们频繁地去检查一个值是否存在,所以我们应该使用集合。集合的使用语法和列表的使用语法类似,所以我们可以这样使用:
    
    noprimes = set(j for i in range(2, 8) for j in range(i*2, 50, i))
    primes = [x for x in range(2, 50) if x not in noprimes]

  3、嵌套列表降维
    假设你有一个列表的列表(列表里包含列表)或者一个矩阵:
    matrix = [[0,1,2,3], [4,5,6,7], [8,9,10,11]]
    并且你想把它降维到一个一维列表。你可以这样做:    
    flattened = []
    for row in matrix:
        for i in row:
            flattened.append(i)
    使用列表生成式:
    flattened = [i for row in matrix for i in row]
    
    注:这使用了两个for循环去迭代整个矩阵。外层(第一个)循环按行迭代,内部(第二个)循环对该行的每个项进行迭代。

  4、模拟多个掷硬币事件
    假设需要模拟多次掷硬币事件,其中0表示正面,1表示反面,你可以这样编写代码:    
    from random import random
    results = []
    for x in range(10):
        results.append(int(round(random())))
    使用列表生成式使代码更简洁:    
    from random import random
    results = [int(round(random())) for x in range(10)]

    注:这里使用了range函数循环了10次。每一次我们都把random()的输出进行四舍五入。因为random()函数返回一个0到1的浮点数,所以对输出进行四舍五入就会返回0或者1。Round()函数返回一个浮点型数据,使用int()将其转为整型并添加到列表里。

  5、移除句子中的元音字母
    假设你有一个句子,sentence = 'Your mother was a hamster'  并且你想移除所有的元音字母。我们可以使用几行代码轻易做到:    
    vowels = 'aeiou'
    non_list = []
    for l in sentence:
        if not l in vowels:
            non_list.append(l)
    nonvowels = ''.join(non_list)

    使用列表生成式简化它:    
    vowels = 'aeiou'
    nonvowels = ''.join([l for l in sentence if not l in vowels])
   
    注:这个例子使用列表生成式创建一个字母列表,字母列表的字母来自sentence句子的非元音字母。然后我们把生成的列表传给join()函数去转换为字符串。
    修正:正如reddit上的iamadogwhatisthis提出的,这个例子不需要列表生成式。使用生成器(generator)更好:   
    vowels = 'aeiou'
    nonvowels = ''.join(l for l in sentence if not l in vowels)
    注意,这里去掉了方括号。这是因为join函数接收任意可迭代的数据,包括列表或者生成器。这个没有方括号的语法使用了生成器。这产生(与列表生成式)同样的结果,相对于之前把所有条目包装成一个列表,生成器在我们遍历时才产生相应的条目。这可以使我们不必保存整个列表到内存,并且这对于处理大量数据更有效率。

  6、获取目录里的文件名列表
    下面的代码将会遍历my_dir目录下的文件,并在files里追加每个以txt为后缀的文件名。    
    import os
    files = []
    for f in os.listdir('./my_dir'):
        if f.endswith('.txt'):
            files.append(f)

    使用列表生成式简化代码:
    import os
    files = [f for f in os.listdir('./my_dir') if f.endswith('.txt')]

    或者你可以获取一个相对路径的列表:
    import os
    files = [os.path.join('./my_dir', f) for f in os.listdir('./my_dir') if f.endswith('.txt')]

  7、将csv文件读取为字典列表
    我们常常需要读取和处理csv文件的数据。处理csv数据的一个最有用的方法就是把它转换为一个字典列表。
    import csv
    data = []
    for x in csv.DictReader(open('file.csv', 'rU')):
        data.append(x)

    使用列表生成式快速实现:
    import csv
    data = [ x for x in csv.DictReader(open('file.csv', 'rU'))]

    注:DictReader类将会自动地使用csv文件的第一行作为字典的key属性名。DictReader类返回一个将会遍历csv文件所有行的对象。这个文件对象通过open()函数产生。我们提供了open()两个参数–第一个是csv文件名,第二个是模式。在这例子,‘rU’有两个意思。想往常一样,‘r’表示以读模式打开文件。‘U’表明我们将会接受通用换行符–‘n’,‘r’和‘rn’。




    
    



    








   

    
   
    
     
     































    
 
 
 

你可能感兴趣的:(python中的推导式(list,dict...))