工具函数:
def collect_na_value(dataframe):
return dataframe.isna().sum() / dataframe.shape[0] * 100
import pandas as pd
def collect_na_value(dataframe):
return dataframe.isna().sum() / dataframe.shape[0] * 100
if __name__ == '__main__':
df = pd.DataFrame(data=[[1, 2, 3],
[2, 3, None],
[None, 1, None],
[1, 2, 3],
[1, 2, 3], ])
print(collect_na_value(df))
得到结果:
0 20.0
1 0.0
2 40.0
表示:
第1列20%的数据是空值;
第2列0%的数据是空值;
第3列40%的数据是空值;