Python词频统计

场景: 现在要统计一个文本中的词频,然后按照频率的降序进行排列
1.第一种方法
tf = {
      'b':5,
      'c':10,
      'a':15,
      'd':3
      }

>> f = zip(tf.keys(),tf.values())

>> f = sorted(f,key = lambda x :x[1],reverse = True)
[('a', 15), ('c', 10), ('b', 5), ('d', 3)]

>> data = pd.DataFrame(f,columns=['字母','数量'])
  字母  数量
0  a  15
1  c  10
2  b   5
3  d   3








2.第二种方法
tf = {
      'b':5,
      'c':10,
      'a':15,
      'd':3
      }

>> f = tf.items()
dict_items([('b',5),('c',10),('a',15),('d',3)])


from operator import itemgetter

>> f = sorted(f,key=itemgetter(1),reverse = True)
[('a', 15), ('c', 10), ('b', 5), ('d', 3)]

>> data = pd.DataFrame(f,columns=['字母','数量'])
  字母  数量
0  a  15
1  c  10
2  b   5
3  d   3


你可能感兴趣的:(Python词频统计)