二、数据清洗(Python描述)

1. 处理缺失值

1.1 用众数或者平均值填充

函数:pandas.DataFrame.fillna

2. 将字符串转换为数值

代码:

#这里把性别数据值字符串不便于计算换成数值,
#用1代表男性,用0代表女性,将性别数值化
def sex_value(Sex):
    if Sex=='male':
        return 1
    else:
        return 0

df['Sex']=df['Sex'].apply(lambda x:sex_value(x))

你可能感兴趣的:(二、数据清洗(Python描述))