示例代碼
df1 = pd.DataFrame(
{
'terms' : ['term1','term2'],
'code1': ['1234x', '4321y'],
'code2': ['2345x','5432y'],
'code3': ['3456x','6543y']
}
)
df1 = df1[['terms'] + df1.columns[:-1].tolist()]
df2 = pd.DataFrame(
{
'name': ['Dan','Sara','Conroy'],
'rate': ['3','3.5','5.2'],
'location': ['FL','OH','NM'],
'code': ['4444g','6543y','2345x']
})
df2 = df2[['name','rate','location','code']]
要合併「代碼」列到一個新列,這會導致一個值我想要添加到行的第二數據幀,其中有一個匹配。
df1['allcodes'] = df1[df1.columns[1:]].apply(lambda x: ','.join(x.dropna().astype(str)),axis=1)
現在DF1的樣子:
terms code1 code2 code3 allcodes
0 term1 1234x 2345x 3456x 1234x,2345x,3456x
1 term2 4321y 5432y 6543y 4321y,5432y,6543y
我需要做的是,如果DF2 [ '代碼']在DF1 [ 'allcodes'],allcodes的相應值添加到在df2中有一個匹配的行的結尾。
最終的結果應該是:
name rate location code allcodes
0 Sara 3.5 OH 6543y 4321y,5432y,6543y
1 Conroy 5.2 NM 2345x 1234x,2345x,3456x
丹不應該在那裏,因爲他的代碼是不是在DF1
我期待和合並/加盟/ CONCAT,但隨着表是不同的大小和df2的代碼可以出現在df1的多列,我不知道如何使用這些功能。
這次是爲lambda函數,也許與地圖?任何想法讚賞。