数据清洗常用代码

数据清洗过程中,经常需要对缺失值和异常值进行查看和处理,常用代码总结如下:

一、缺失值处理
1.1 缺失值识别

# 查看数据缺失情况
# 输入数据集
# 输出各字段缺失值的数量以及占比,并降序展示
def missing(data):
    missingSum=data.isnull().sum() #总缺失值
    missingSumPrt=100 * data.isnull().sum()/len(data)  #缺失值占比
    MissingTb1=pd.concat

你可能感兴趣的:(数据分析,数据清洗)