numpy 和 matplotlib学习
计划:周末完成所有~
Series:
创建一个一维的数组
取不连续的索引:
df[['hello','world']]
得到 1,2
Series对象本质上由两个数组构成,一个数组构成的对象的键(index,索引),一个数组构成的对象的值(values),键 -> 值/
DataFrame:
二位数组,series容器
不但有行索引,还有列索引(axis=1,列索引(columns),否则为行索引(index))
df 基础属性:
tolist() 可将Series转化成列表.
缺失数据处理:
pd.isnull(df) # 判断是否有nan,有返回True
pd.notnull(df) # 判断是否有nan,有返回False
df.dropna(axis=0,how='any') # 只要有就删除
df.dropna(axis=0,how='all') # 一行全为nan就删除
df.dropna(axis=0,how='all',inplace=True) # inplace 是否替换
df.fillna(100) # 把df中的nan值填充成100
df.fillna(df['某一列'].mean()) # 一般填充平均值
df[df == 0] = np.nan # 处理为0 的数据(必须要确定当前这个零表示的是数据缺失才能这样处理)