字典的基础及字典的使用实例


1.字典:针对非序列集合而提供的一种数据类型

  通过任意键值查找集合中值信息的过程叫做映射。

  python中通过字典实现映射。

  字典是一个键值对的集合。该集合以键为索引,同一个键信息对应一个值。

2.字典的操作

  1)为字典增加一项dictionaryName[key]=value

  举例:

 字典的基础及字典的使用实例_第1张图片

2)字典的遍历

for key in dictionaryName:

      print(key+”:”+str(dictiionaryName[key]))

   

遍历字典的键key

  for key in dictionaryName.keys():

print(key)

遍历字典的值value

  for value in dictionaryName.values():

print(value)

遍历字典的项

  for item in dictionaryName.items():

print(item)

遍历字典的key-value

  for item,value in adict.items():

print(item,value)

3)是否一个键在字典中

  in 或者 not in

4)字典的标准操作符

  -,<,>,<=,>=,==,!=,and,or,not

5)字典方法

keys():tuple 返回一个包含字典所有key的列表

values():tuple 返回一个包含所有value的列表

items():tuple  返回一个包含所有键值的列表

clear():None 删除字典中的所有项目

get(key):value 返回字典中key对应的值

pop(key):val 删除并返回字典中key对应的值

update(字典) 将字典中的键值添加到字典中

6)字典的实例一:统计词频的问题

IPO模式

输出:从文件中读取一篇英文文章

处理:统计文件中每个单词的出现频率

输出:将最常出现的10个单词及出现次数,以图表形式输出

 

统计词频

第一步:输入英文文章

第二步:建立用于词频计算的空字典

第三步:对文本的每一行计算词频

第四步:从字典中获取数据对到列表中

第五步:对列表中的数据对交换位置,并从大到小进行排序

第六步:输出结果

第七步:用Turtle库绘制统计词频结果的图标

 

#统计一行词频processLine()

def processLine(line,wordCounts):

    #用空格替换标点符号

    line=replacePunctuations(line)

    #从每一行获取每个词

    words=line.split()

    for word in words:

        if word in wordCounts:

            wordCounts[word] += 1

        else:

            wordCounts[word] = 1

 

#符号替换relpeacePunctuation

def relpacePunctuations(line):

    for ch in line:

        if ch in "~@#$%^&*()_-+=<>?/,.:;{}[]|\'""":

            line = line.replace(ch, " ")

    return line

 

#输入英文文本名称

filename=input("enter a filename:".strip())

infile=open(filename,"r")

 

字典的基础及字典的使用实例_第2张图片

 

import turtle
 
##全局变量##
#词频排列显示个数
count = 10
#单词频率数组-作为y轴数据
data = []
#单词数组-作为x轴数据
words = []
#y轴显示放大倍数-可以根据词频数量进行调节
yScale = 6
#x轴显示放大倍数-可以根据count数量进行调节
xScale = 30
 
################# Turtle Start  ####################  
#从点(x1,y1)到(x2,y2)绘制线段
def drawLine(t, x1, y1, x2, y2):
    t.penup()
    t.goto (x1, y1)
    t.pendown()
    t.goto (x2, y2)
 
# 在坐标(x,y)处写文字
def drawText(t, x, y, text):
    t.penup()
    t.goto (x, y)
    t.pendown()
    t.write(text)
 
def drawGraph(t):
    #绘制x/y轴线
    drawLine (t, 0, 0, 360, 0)
    drawLine (t, 0, 300, 0, 0)
 
    #x轴: 坐标及描述
    for x in range(count):
        x=x+1 #向右移一位,为了不画在原点上
        drawText(t, x*xScale-4, -20, (words[x-1]))
        drawText(t, x*xScale-4, data[x-1]*yScale+10, data[x-1])
    drawBar(t)
 
#绘制一个柱体
def drawRectangle(t, x, y):
    x = x*xScale
    y = y*yScale#放大倍数显示
    drawLine(t, x-5, 0, x-5, y)
    drawLine(t, x-5, y, x+5, y)
    drawLine(t, x+5, y, x+5, 0)
    drawLine(t, x+5, 0, x-5, 0)
     
#绘制多个柱体
def drawBar(t):
    for i in range(count):
        drawRectangle(t, i+1, data[i])    
################# Turtle End  ####################
 
         
#对文本的每一行计算词频的函数
def processLine(line, wordCounts):
    #用空格替换标点符号
    line = replacePunctuations(line)
    #从每一行获取每个词
    words = line.split() 
    for word in words:
        if word in wordCounts:
            wordCounts[word] += 1
        else:
            wordCounts[word] = 1
 
#空格替换标点的函数
def replacePunctuations(line):
    for ch in line:
        if ch in "~@#$%^&*()_-+=<>?/,.:;{}[]|\'""":
            line = line.replace(ch, " ")
    return line
 
def main():
    #用户输入一个文件名
    filename = input("enter a filename:").strip()
    infile = open(filename, "r")
     
    #建立用于计算词频的空字典
    wordCounts = {}
    for line in infile:
        processLine(line.lower(), wordCounts)
         
    #从字典中获取数据对
    pairs = list(wordCounts.items())
 
    #列表中的数据对交换位置,数据对排序
    items = [[x,y]for (y,x)in pairs] 
    items.sort() 
 
    #输出count个数词频结果
    for i in range(len(items)-1, len(items)-count-1, -1):
        print(items[i][1]+"\t"+str(items[i][0]))
        data.append(items[i][0])
        words.append(items[i][1])
         
    infile.close()
     
    #根据词频结果绘制柱状图
    turtle.title('词频结果柱状图')
    turtle.setup(900, 750, 0, 0)
    t = turtle.Turtle()
    t.hideturtle()
    t.width(3)
    drawGraph(t)

#调用main()函数
if __name__ == '__main__':
    main()

7)字典的实例二:使用字典结构合并新地址簿的问题

 

#利用字典将两个通讯录文本合并为一个文本
def main():
        ftele2=open('TeleAddressBook.txt','rb')
        ftele1=open('EmailAddressBook.txt','rb')
 
        ftele1.readline()#跳过第一行
        ftele2.readline()
        lines1 = ftele1.readlines()
        lines2 = ftele2.readlines()
 
        dic1 = {}   #字典方式保存
        dic2 = {}
 
 
        for line in lines1:#获取第一个本文中的姓名和电话信息
                elements = line.split()
                #将文本读出来的bytes转换为str类型
                dic1[elements[0]] = str(elements[1].decode('gbk'))
                 
        for line in lines2:#获取第二个本文中的姓名和电话信息
                elements = line.split()
                dic2[elements[0]] = str(elements[1].decode('gbk'))
 
        ###开始处理###
        lines = []
        lines.append('姓名\t    电话   \t  邮箱\n')
 
        for key in dic1:
            s= ''
            if key in dic2.keys():
                    s = '\t'.join([str(key.decode('gbk')), dic1[key], dic2[key]])
                    s += '\n'
            else:
                    s = '\t'.join([str(key.decode('gbk')), dic1[key], str('   -----   ')])
                    s += '\n'
            lines.append(s)
             
        for key in dic2:
            s= ''
            if key not in dic1.keys():
                    s = '\t'.join([str(key.decode('gbk')), str('   -----   '), dic2[key]])
                    s += '\n'       
            lines.append(s)
 
        ftele3 = open('AddressBook.txt', 'w')
        ftele3.writelines(lines)
 
        ftele3.close()
        ftele1.close()
        ftele2.close()
        print("The addressBooks are merged!")

if __name__ == "__main__":
            main()

你可能感兴趣的:(python语言基础)