2020-03-08 学习记录

数据预处理

第一行代码输出前十行数据,发现有缺失值,age_is_null打印空值。若为空则显示true。age_null_true会把缺失数据打印出来。最后一行代码则可以显示出来一共有几个缺失值。

用平均值来替代缺失值

mean_age=sum(data["age"])/len(data["age"])

print(mean_age) #打印出来是nan  因为元数据中有缺失值 所以计算不出来。讲非缺失的数据拿出来进行单独计算。

good_ages=data["age"][" age_is_null "=false]

correct_mean_age=sum( good_ages )/len( good_ages )

#也可以使用mean函数

data["age"].mean()也可以输出结果


打印一二三等舱的平均价格


可以直接用数据透视表(方便)

数据透视表


删除缺失值

重新定义索引值 .rest_index


根据age来进行划分 三类


用分好类的age建立数据透视表

你可能感兴趣的:(2020-03-08 学习记录)