python中利用pandas等处理数据的一些常用操作

1.read_excel('路径.xls',names=["a","b"])

 

 

2.to_excel('路径.xls',header=False,index=False)

 

 

3.dropna()过滤缺失数据

如果是Series,则返回一个仅含非空数据和索引值的Series,默认丢弃含有缺失值的行。

df.dropna(how = 'all')    # 传入这个参数后将只丢弃全为缺失值的那些行
df.dropna(axis = 1)       # 丢弃有缺失值的列(一般不会这么做,这样会删掉一个特征)
df.dropna(axis=1,how="all")   # 丢弃全为缺失值的那些列
df.dropna(axis=0,how="all")   # 丢弃全为缺失值的那些行
df.dropna(axis=0,subset = ["Age", "Sex"])   # 丢弃‘Age’和‘Sex’这两列中有缺失值的行    

4.pd.DataFrame()

 

 

5.df.loc

 

6.df.iloc

 

 

 

 

 

你可能感兴趣的:(python数据处理基础)