Python-Collections学习

Collections


  • Counter:计数器,用于统计元素的数量
  • OrderDict:有序字典
  • defaultdict:值带有默认类型的字典
  • namedtuple:可命名元组,通过名字来访问元组元素
  • deque:双向队列,队列头尾都可以放,也都可以取(与单向队列对比,单向队列只能一头放,一头取)

用法

  1. Counter
  • 计数器,用于统计对象中每个元素出现的个数:Counter是dict的一个子类,实例:

        #通过字典形式统计每个元素重复的次数传     
        res = collections.Counter('abcdabcaba')  
        print(res)                                  #结果Counter({'a': 4, 'b': 3, 'c': 2, 'd': 1})  
          
        #dict的子类,所以也可以以字典的形式取得键值对  
        for k in res:  
            print(k, res[k], end='  |  ')           #结果 a 4  |  b 3  |  c 2  |  d 1  |  
        for k, v in res.items():  
            print(k, v, end='  |  ')                #结果 a 4  |  b 3  |  c 2  |  d 1  |  
      
        #通过most_common(n),返回前n个重复次数最多的键值对  
        print(res.most_common())                    #结果None  
        print(res.most_common(2))                   #结果[('a', 4), ('b', 3)]  
          
        #通过update来增加元素的重复次数,通过subtract来减少元素重复的次数  
        a = collections.Counter('abcde')  
        res.update(a)  
        print(res)                                  #结果Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2, 'e': 1}),比原来的res增加了重复次数  
          
        b = collections.Counter('aaafff')  
        res.subtract(b)  
        print(res)                                  #结果Counter({'b': 4, 'c': 3, 'a': 2, 'd': 2, 'e': 1, 'f': -3}),还有负值,要注意  
          
        #fromkeys功能还没实现,使用的话会报错
    
  1. OrderDict

    • 有序字典,数据结构字典Dict是无序的,有时使用起来不方便,Collections里提供一个有序字典:dict的方法ORderDict基本都可以使用,比如keys,values,clear

        #创建一个有序字典
        dic = collections.OrderedDict()
        dic['name'] = 'winter'
        dic['age'] = 18
        dic['gender'] = 'male'
        
        print(dic)                         #结果OrderedDict([('name', 'winter'), ('age', 18), ('gender', 'male')])
        
        #将一个键值对放入最后
        dic.move_to_end('name')
        print(dic)                         #结果OrderedDict([('age', 18), ('gender', 'male'), ('name', 'winter')])
      
  2. defaultdict

    • 默认字典,为字典设置一个默认类型,很有用。

        #传统方法
        people = [['male', 'winter'], ['female', 'elly'], ['male', 'frank'], ['female', 'emma']]
        #将男性女性分开,所有男性放到'male'中,所有女性放放到'female'中
        gender_sort = {}
      
        for info in people:
            if info[0] in gender_sort:
                gender_sort[info[0]].append(info[1])
            else:
                gender_sort[info[0]] = [info[1]]
        
        print(gender_sort)                              #结果{'male': ['winter', 'frank'], 'female': ['elly', 'emma']}
      
        #使用defaultdict简单很多
        people = [['male', 'winter'], ['female', 'elly'], ['male', 'frank'], ['female', 'emma']]
      
        gender_sort = collections.defaultdict(list)
        for info in people:
            gender_sort[info[0]].append(info[1])
        
        print(gender_sort)      #结果defaultdict(, {'male': ['winter', 'frank'], 'female': ['elly', 'emma']})
      
  3. namedtuple

  • 可命名元组,给元组每个元素起一个名字,这样就可以通过名字来访问元组里的元素,增加可读性,尤其是对于坐标,html标签的长宽等。

       position_module = collections.namedtuple('position', ['x', 'y', 'z'])   #'position'相当于指定一个类型,类似于上面的OrderedDict([('age', 18), ('gender', 'male'), ('name', 'winter')])中的OrderdDict
    
       a_position = position_module(3, 5, 7)
       print(a_position)                                   #结果position(x=3, y=5, z=7)
       print(a_position.x, a_position.y, a_position.z)     #结果3 5 7    
       
       #更加有用
       import collections
    
       login_user = [
           (r'http://www.baidu.com', 'usr1', 'pwd1'),
           (r'http://www.youdao.com', 'usr2', 'pwd2'),
           (r'http://mail.126.com', 'usr3', 'pwd3')
       ]
       
       page_info = collections.namedtuple('login_info', ['url', 'username', 'password'])
       for user in login_user:
           x = page_info(*user)
           print(x)
       #输出
       login_info(url='http://www.baidu.com', username='usr1', password='pwd1')
       login_info(url='http://www.youdao.com', username='usr2', password='pwd2')
       login_info(url='http://mail.126.com', username='usr3', password='pwd3')  
    
  1. deque
  • deque其实是 double-ended queue 的缩写,双向队列。说到队列就要说到队列和栈了;队列是FIFO,栈是FILO队列又分为:单向队列(只能从一边放,从另外一边取);双向队列(两头都可以放,也都可以取);Python中单向队列就是queue.Queue。

       raw = [1,2,3]
       d = collections.deque(raw)
       print(d)                    #结果deque([1, 2, 3])
       
       #右增
       d.append(4)
       print(d)                    #结果deque([1, 2, 3, 4])
       #左增
       d.appendleft(0)
       print(d)                    #结果deque([0, 1, 2, 3, 4])
       
       #左扩展
       d.extend([5,6,7])
       print(d)                    #结果deque([0, 1, 2, 3, 4, 5, 6, 7])
       #右扩展
       d.extendleft([-3,-2,-1])
       print(d)                    #结果deque([-1, -2, -3, 0, 1, 2, 3, 4, 5, 6, 7])
       
       #右弹出
       r_pop = d.pop()
       print(r_pop)                #结果7
       print(d)                    #结果deque([-1, -2, -3, 0, 1, 2, 3, 4, 5, 6])
       #左弹出
       l_pop = d.popleft()
       print(l_pop)                #结果-1
       print(d)                    #结果deque([-2, -3, 0, 1, 2, 3, 4, 5, 6])
       
       #将右边n个元素值取出加入到左边
       print(d)                    #原队列deque([-2, -3, 0, 1, 2, 3, 4, 5, 6])
       d.rotate(3)
       print(d)                    #rotate以后为deque([4, 5, 6, -2, -3, 0, 1, 2, 3])

你可能感兴趣的:(Python-Collections学习)