这篇文章讲述的是数据整合。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~
使用Pandas库中的merge()函数合并数据集
import pandas as pd
df1 = pd.DataFrame({'lkey':['b','b','a','c'],'data1':range(4)})
df2 = pd.DataFrame({'rkey':['a','b','b','d'],'data2':range(4)})
merge()从左到右进行合并,用left_on和right_on指定
pd.merge(df1,df2,left_on='lkey',right_on='rkey')
设置how参数outer,可添加两个数据集中left_on与right_on未重合部分
pd.merge(df1,df2,left_on='lkey',right_on='rkey',how='outer')
根据索引合并数据集
import pandas as pd
left1 = pd.DataFrame({'key':['a','b','a','a','b','c'],'value':range(6)})
right1 = pd.DataFrame({'group_val':[3.5,7]},index=['a','b'])
根据left1数据集的key列和right1数据集的索引进行合并
pd.merge(left1,right1,left_on='key',right_index=True,how='outer')
concat()函数对Series或DataFrame进行轴向连接
s1 = pd.Series([0,1],index=['a','b'])
s2 = pd.Series([3,4],index=['c','d'])
使用concat()函数对两个序列进行行连接
pd.concat([s1,s2])
pd.concat([s1,s2],axis = 1)
s3 = pd.concat([s1*5,s2])
pd.concat([s1,s3],axis=1,join='inner')
对DataFrame进行轴向连接
df1 = pd.DataFrame(np.arange(4).reshape((2,2)),columns=['a','b'])
df2 = pd.DataFrame(np.arange(4).reshape((2,2)),columns=['a','c'])
pd.concat([df1,df2])
设置ignore_index = True
pd.concat([df1,df2],ignore_index=True)
各位路过的朋友,如果觉得可以学到些什么的话,点个赞再走吧,欢迎各位路过的大佬评论,指正错误,也欢迎有问题的小伙伴评论留言,私信。每个小伙伴的关注都是本人更新博客的动力!!!