pandas读取csv文件时 不带第一列编号

pandas读取csv文件时 不带第一列编号

在读取kaggle Diamonds数据集的时候,发现把csv文件中自带的 第一列的编号读进来了:

Diamonds_data = pd.read_csv(file_name)
pd.set_option('display.max_columns', 11)
print(Diamonds_data.head())

打印结果:

   Unnamed: 0  carat      cut color clarity  depth  table  price     x     y  \
0           1   0.23    Ideal     E     SI2   61.5   55.0    326  3.95  3.98   
1           2   0.21  Premium     E     SI1   59.8   61.0    326  3.89  3.84   
2           3   0.23     Good     E     VS1   56.9   65.0    327  4.05  4.07   
3           4   0.29  Premium     I     VS2   62.4   58.0    334  4.20  4.23   
4           5   0.31     Good     J     SI2   63.3   58.0    335  4.34  4.35   

      z  
0  2.43  
1  2.31  
2  2.31  
3  2.63  
4  2.75  

上面 Unnamed:0 这一列就是源文件的编号列。

处理方法是,指定参数index_col=0,即如下:

Diamonds_data = pd.read_csv(file_name, index_col=0)
   carat      cut color clarity  depth  table  price     x     y     z
1   0.23    Ideal     E     SI2   61.5   55.0    326  3.95  3.98  2.43
2   0.21  Premium     E     SI1   59.8   61.0    326  3.89  3.84  2.31
3   0.23     Good     E     VS1   56.9   65.0    327  4.05  4.07  2.31
4   0.29  Premium     I     VS2   62.4   58.0    334  4.20  4.23  2.63
5   0.31     Good     J     SI2   63.3   58.0    335  4.34  4.35  2.75

回顾:不读取csv源文件的列名

这里不读取列名的意思是,不将csv文件中的第一行当作dataframe的columns。所以,csv文件从第一行开始,就是Dataframe的第一行数据。
指定参数header = None.

Diamonds_data = pd.read_csv(r"D:\someDatasetsForML\diamonds.csv", index_col=0,header=None)
        1        2      3        4      5      6      7     8     9     10
0                                                                         
NaN  carat      cut  color  clarity  depth  table  price     x     y     z
1.0   0.23    Ideal      E      SI2   61.5     55    326  3.95  3.98  2.43
2.0   0.21  Premium      E      SI1   59.8     61    326  3.89  3.84  2.31
3.0   0.23     Good      E      VS1   56.9     65    327  4.05  4.07  2.31
4.0   0.29  Premium      I      VS2   62.4     58    334   4.2  4.23  2.63

你可能感兴趣的:(scipy,and,seaborn,pandas,python,数据分析)