python单因子探索分析与可视化

satisfaction_level 分析

# @Time : 2018/11/29 21:41

# @Author : Byron

import pandasas pd

import numpyas np

def main():

df = pd.read_csv('./data/HR.csv')

sc_l = df['satisfaction_level']

print(sc_l.isnull())# 打印出对应的行和isnull布尔值

    print(sc_l[sc_l.isnull()])# 打印出cs_l中isnull为true的值

    print(df[sc_l.isnull()])# 打印出df中isnull为true的行

    print(sc_l.mean())# 均值

    print(sc_l.std())# 标准差

    print(sc_l.max())# 最大值

    print(sc_l.min())# 最小值

    print(sc_l.median())# 中位数

    print(sc_l.quantile(q=0.5))# 等价于中位数

    print(sc_l.quantile(q=0.25))# 下四分位数

    print(sc_l.quantile(q=0.5))# 上四分位数

    print(sc_l.quantile(q=0.75))# 下四分位数

    print(sc_l.skew())# 偏度->满意度较高

    print(sc_l.kurt())# 峰度->偏瘦较集中

    print(np.histogram(sc_l.values, bins=np.arange(0.0, 1.1, 0.1)))# 数据分布空间和数值

if __name__ =="__main__":

main()

你可能感兴趣的:(python单因子探索分析与可视化)