学习心得——数据预处理(探索性数据分析)

一、数据预处理的主要目的:

        1、发现数据中可能存在的错误和遗漏。

        2、掌握数据的基本情况,获得进一步分析的灵感

                对数据范围、中值、分散成都等进行探查

        3、检查要执行的统计检验的假设是否成立

                许多统计检验对数据本身存在一定都要求(分布形态),需满足要求时,统计检验才有意义。

二、不同的数据类型探索性分析

  1、离散型数据

        定义:典型例子,性别、种族、职业等。离散数据中,分有序变量(比如教育程度,可以有顺序排列),也有名义变量(比如性别、职业,无排序规则)。

        探索性分析方法:构建频数表(占比)

  2、连续型数据:

        定义:数值有具体的科学意义,并且可以在数轴上的某个范围连续取值。

        探索性分析方法:平均数、中位数、方差、标准差、频率直方图

学习心得——数据预处理(探索性数据分析)_第1张图片

 

        

你可能感兴趣的:(数据分析,数据分析)