Python合并有相同列的两个表格

问题是有相同列的两个表格合并,但是列中的值顺序不一样,所以需要用到merge函数。 

import pandas as pd
import os

print(os.getcwd()) #打印出当前工作路径
df5 = pd.read_csv("C:\\Users\\hanhan\\PycharmProjects\\pythonProject\\5.csv",encoding = 'gb2312',dtype='str')
df6 = pd.read_csv("C:\\Users\\hanhan\\PycharmProjects\\pythonProject\\6.csv",encoding = 'gb2312',dtype='str')
df_pri = pd.merge(df5,df6,on='key')
df_pri.to_csv('result.csv',header=True,index=False)

首先,表格存为CSV格式。

import os

print(os.getcwd())

是为了打印出当前的工作路径,我一般把文件放在当前路径下。 

打印出来的路径为C:\Users\hanhan\PycharmProjects\pythonProject

但是Python读取文件的时候会对\符号进行转义,所以可以在前面加一个r,也可以写成双斜线\\。

接着就是读取两个表格,用到的是pd.read_csv

因为表格中有中文字符,所以使用了encoding = 'gb2312',国际码。

又因为怕格式不统一,、所以统一用字符串格式:dtype='str'

df_pri = pd.merge(df5,df6,on='key')

相同列的列名为key。

然后结果存为CSV文件,导出位置也在当前路径。 

你可能感兴趣的:(数据分析,python)