Pandas在读取csv时如何设置列名--常用方法集锦

今天来整理下如何在读CSV的时候正确处理列名。

  1. csv文件自带列标题
    原始数据是有列标的,用excel打开是这样的:


    Pandas在读取csv时如何设置列名--常用方法集锦_第1张图片
    Screen Shot 2018-08-30 at 8.20.36 PM.png
import pandas as pd
df_example = pd.read_csv('Pandas_example_read.csv')

这种方法等同于

df_example = pd.read_csv('Pandas_example_read.csv', header=0)

结果都是:


Pandas在读取csv时如何设置列名--常用方法集锦_第2张图片
Screen Shot 2018-08-30 at 8.06.12 PM.png
  1. csv文件有列标题,但是想自己换成别的列标题:
    2.1 在读数之后自定义标题:
df_example = pd.read_csv('Pandas_example_read.csv')
df_example.columns = ['A','B','C']

2.2 在读数的同时自定义标题:

df_example = pd.read_csv('Pandas_example_read.csv', names=['A', 'B','C'])

或者

df_example = pd.read_csv('Pandas_example_read.csv', header=0, names=['A', 'B','C'])

2.1和2.2效果都是一样的,读取文件,并且改列名:


Pandas在读取csv时如何设置列名--常用方法集锦_第3张图片
Screen Shot 2018-08-30 at 8.10.49 PM.png
  1. csv文件没有列标题,从第一行就直接开始是数据的录入了:
    原始数据是没有列标的,用excel打开呈现是这样的:


    Pandas在读取csv时如何设置列名--常用方法集锦_第4张图片
    Screen Shot 2018-08-30 at 8.20.49 PM.png
df_example_noCols = pd.read_csv('Pandas_example_read_withoutCols.csv', header=None)

这个时候一定要加'header=None', 这样读进来的列名就是系统默认的0,1,2... 序列号:


Pandas在读取csv时如何设置列名--常用方法集锦_第5张图片
Screen Shot 2018-08-30 at 8.14.00 PM.png
  1. csv文件没有列标题,但是自己想加上列标题:
    4.1 读进来数之后加上标题
df_example_noCols = pd.read_csv('Pandas_example_read_withoutCols.csv', header=None)
df_example_noCols.columns = ['A', 'B','C']

4.2 读数的同时加标题

df_example_noCols = pd.read_csv('Pandas_example_read_withoutCols.csv', names=['A', 'B','C'])

或者

df_example_noCols = pd.read_csv('Pandas_example_read_withoutCols.csv', header=None, names=['A', 'B','C'])

注意:这里不可以用'header=0', 用了之后就会导致第一行的数据先被当成了列名,然后又被重命名覆盖,结果是第一行的数据丢失。

你可能感兴趣的:(Pandas在读取csv时如何设置列名--常用方法集锦)