python用符号拼接DataFrame两列

问题描述

如下图的日期dataframe,需要把开始日期和结束日期拼接在一起

原dataframe

开始日期 结束日期
2020-08-03 2020-08-09
2020-08-10 2020-08-16
2020-08-17 2020-08-23
2020-08-24 2020-08-30
2020-08-31 2020-09-06

拼接后的dataframe

开始日期 结束日期 插入日期
2020-08-03 2020-08-09 2020-08-03 ~ 2020-08-09
2020-08-10 2020-08-16 2020-08-10 ~ 2020-08-16
2020-08-17 2020-08-23 2020-08-17 ~ 2020-08-23
2020-08-24 2020-08-30 2020-08-24 ~ 2020-08-30
2020-08-31 2020-09-06 2020-08-31 ~ 2020-09-06

解决方案

方案一:apply映射

# 方案1
date_xl['插入日期']=date_xl.apply(lambda x:x['开始日期']+" ~ "+x['结束日期'],axis=1)

# 方案2
date_xl['插入日期']=date_xl.apply(lambda x:" ~ ".join(x.values),axis=1)

上面两种方法,原理基本一致

碰到Null值时,会报错,因为none不可与str运算
解决如下,加入if判断即可

df = pd.DataFrame([list("ABCDEF"),
             list("ABCDE")]).T
df.columns=list('XY')
df.apply(lambda x:" ~ ".join(x.values) if (x.values[0]!= None) &(x.values[1] != None) else np.nan,axis=1)

方案二:转成嵌套数组/列表

# 转换成嵌套数组
df.values 
np.array(df)

#转换成嵌套列表
df.values.tolist()
np.array(df).tolist()

# 拼接
pd.DataFrame([" ~ ".join(i)  if (i[0]!= None) &(i[1] != None) else np.nan for i in np.array(df).tolist()])

你可能感兴趣的:(Python,python,dataframe拼接两列)