【利用Python进行数据分析——经验篇1】将Excel表中几列合并到一列中

我们都知道,在Excel中可以很容易实现,采用‘A1&B1’ 或者利用CONCATENATE(A1&B1)方式可以实现,但是在Python的pandas包中,本人没有找到合适的用于连接表中两列的函数,因此本人使用了字符串连接的方式。

本文中案例以【利用python进行数据分析——基础篇】利用Python处理和分析Excel表中数据实战的实战数据为例

首先查看该表格中各个列中的数据类型:

使用语句:aa.dtypes



1)若想要连接的几列的数据类型都是字符串型,可以直接使用‘+’连接

test[u'简称省会']= test[u'简称']+test[u'省会']
test[u'简称省会']

【利用Python进行数据分析——经验篇1】将Excel表中几列合并到一列中_第1张图片


2)若想要连接的几列中存在非字符串型的,可以先将要连接的列的数据格式转成字符串型,再使用‘+’连接

aa.sort_values(by=u'综合h指数', ascending=False, inplace=True)
# 按照综合h指数降序排序,添加一个排序位数
aa['rank'] = np.arange(34)+1

# 要想得到“综合h指数/排名"的列,需要将aa['rank']和aa[u'综合h指数']进行合并成一列,这就要求必须连接字符串类型
aa['rank'] = aa['rank'].astype('string_')
aa[u'综合h指数'] = aa[u'综合h指数'].astype('string_')
# 连接成一列
aa[u'综合h指数/排名'] = aa[u'综合h指数']+'/'+ aa['rank']

print aa[u'综合h指数/排名'][0]
output:
综合h指数/排名                                  41.3333/1

 
  
 
  
 
  
 
  
 
  
 
  
 
  
 
  
 
  
 
 

你可能感兴趣的:(Python实用操作基础)