python3 文件合并

合并文件,相同的属性最终只出现一次,待合并的2个文件如下:

python3 文件合并_第1张图片

python3 文件合并_第2张图片

名字相同,我们就视为是同一个人,python3代码如下:

#打开文件
#文件中出现了中文,为了能够正确处理中文,不出现乱码,打开模式采用'rb'
f1=open(r'C:\Users\Administrator\Desktop\TeleBook.txt','rb')
f2=open(r'C:\Users\Administrator\Desktop\EmailBook.txt','rb')
#跳过第一行
f1.readline()
f2.readline()
#读取文件,列表lines1和lines2分别存储了电话信息和邮箱信息的二进制数据。
lines1=f1.readlines()
lines2=f2.readlines()
#建立空列表用于存储姓名,电话,Email
list1_name=[]
list1_tele=[]
list2_name=[]
list2_email=[]
#获取TeleBook.txt中的信息
for line in lines1:
    elements=line.split()
    #由于elements中是中文的'gbk'二进制编码,为确保中文字符正常显示,我们
    #使用decode('gbk')进行'gbk'解码。
    list1_name.append(elements[0].decode('gbk'))
    list1_tele.append(str(elements[1].decode('gbk')))
#获取EmailBook.txt中的信息
for line in lines2:
    elements=line.split()
    list2_name.append(str(elements[0].decode('gbk')))
    list2_email.append(elements[1].decode('gbk'))
#生成新的数据
lines=[]
lines.append('姓名\t    电话    \t  邮箱\n')
#按索引方式遍历姓名列表1
for i in range(len(list1_name)):
    if list1_name[i] in list2_name:
        j=list2_name.index(list1_name[i])
        s='\t'.join([list1_name[i],list1_tele[i],list2_email[j]])
        s+='\n'
    else:
        s='\t'.join([list1_name[i],list1_tele[i],str('  -----  ')])
        s+='\n'
    lines.append(s)
#处理姓名列表2中剩余的姓名
for i in range(len(list2_name)):
    if list2_name[i] not in list1_name:
        s='\t'.join([list2_name[i],'  ----  ',list2_email[i]])
        s+='\n'
        lines.append(s)
#将新生成的合并数据写入新的文件中
f3=open(r'C:\Users\Administrator\Desktop\AddressBook.txt','w')
f3.writelines(lines)
#关闭文件
f1.close()
f2.close()
f3.close()


print("The addressBooks are merged")

合并后文件如下:

python3 文件合并_第3张图片


你可能感兴趣的:(python,数据,乱码,合并文件)