pandas学习——综合练习题

pandas学习——综合练习题_第1张图片
文本数据、分类数据、时序数据
【练习一】现有一份虚拟数据集,列类型分别为string/浮点/整型,请解决如下问题:
(a)请以列类型读入数据,并选出C为缺失值的行。
(b)现需要将A中的部分单元转为缺失值,单元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比。

pandas学习——综合练习题_第2张图片

df.dtypes
df[df['C'].isna()]

pandas学习——综合练习题_第3张图片

(b)现需要将A中的部分单元转为缺失值,单元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比

df = pd.read_csv('data/Missing_data_one.csv').convert_dtypes()
total_b = df['B'].sum()
min_b = df['B'].min()
df['A'] = pd.Series(list(zip(df['A'].values
                    ,df['B'].values))).apply(lambda x:x[0] if np.random.rand()>0.25*x[1]/min_b else np.nan)
df.head()

pandas学习——综合练习题_第4张图片

你可能感兴趣的:(pandas学习,python学习,笔记)