Python | Pandas | 行、列新增及重命名

此文主要介绍如何使用pandas对行、列进行重命名

Last Modified Date: 2022 / 6 / 22


Python | Pandas | 行、列新增及重命名

  • 新增
  • 重命名
      • 原始数据
      • 部分
        • rename
      • 全部
        • 赋值
  • 参考文章


新增

参考此处 1


重命名


参考此处 2

原始数据

data = pd.read_excel(io='analysis.xlsx')
print(data.head(3))
'''
          id        uid  ... diqu  city
0  553217640  6376967.0  ...   广西   南宁市
1  553217639  6376967.0  ...   广西   南宁市
2  553217638  6571870.0  ...  浙江省   杭州市

[3 rows x 11 columns]
'''

部分

有时候,我们只需要将部分列的列名重命名。可以使用字典的方式,更改指定的列名。

rename

### rename dict: key, default field of raw data; value, new field
rename = {
    'id': 'user',
    'diqu': 'province'
}
data = data.rename(columns=rename)
print(data.head(3))
'''
        user        uid  ... province  city
0  553217640  6376967.0  ...       广西   南宁市
1  553217639  6376967.0  ...       广西   南宁市
2  553217638  6571870.0  ...      浙江省   杭州市

[3 rows x 11 columns]
'''

全部

df.columns = new_columns, new_coumns 可以是列表或元组, 但新旧列名的长度必须一致,否者会不匹配报错。这种改变方式是直接改变了原始数据。

赋值

'''
print(len(data.columns.to_list()))
11
'''

### rename list: target fields
rename = ['user', 'uid', 'title', 'docid', 'time', 'status', 'score', 'qudao', 'kffs', 'province', 'city']
'''
print(len(rename))
11
'''

data.columns = rename
print(data.head(3))
'''
        user        uid  ... province  city
0  553217640  6376967.0  ...       广西   南宁市
1  553217639  6376967.0  ...       广西   南宁市
2  553217638  6571870.0  ...      浙江省   杭州市

[3 rows x 11 columns]
'''

参考文章


  1. DataFrame 新增列的五种方法 ↩︎

  2. pandas DataFrame数据重命名列名的几种方式 ↩︎

你可能感兴趣的:(Pandas,python,pandas,排序)