Python Day17

numpy 和 matplotlib学习

计划:周末完成所有~

Series:

创建一个一维的数组

取不连续的索引:

 df[['hello','world']]

得到 1,2

Series对象本质上由两个数组构成,一个数组构成的对象的键(index,索引),一个数组构成的对象的值(values),键 -> 值/

DataFrame:

二位数组,series容器

不但有行索引,还有列索引(axis=1,列索引(columns),否则为行索引(index))

df 基础属性:

 tolist() 可将Series转化成列表.

缺失数据处理:

pd.isnull(df)  # 判断是否有nan,有返回True

pd.notnull(df) # 判断是否有nan,有返回False

df.dropna(axis=0,how='any') # 只要有就删除

df.dropna(axis=0,how='all') # 一行全为nan就删除

df.dropna(axis=0,how='all',inplace=True) # inplace 是否替换

df.fillna(100) # 把df中的nan值填充成100

df.fillna(df['某一列'].mean()) # 一般填充平均值

df[df == 0] = np.nan # 处理为0 的数据(必须要确定当前这个零表示的是数据缺失才能这样处理)
 

你可能感兴趣的:(python)