20161230:数据分析入门01

1.比例vs比率。比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。比率是反映一个整体中各部分之间的关系。

2.同比是历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况;环比是指与前一个统计期比较得到的数值,该指标主要反映的是事物逐期发展的情况。

3.数据清洗工作。(1)重复数据的处理:函数(Excel中的COUNTIF)、高级筛选、条件格式(Excel 2010,“开始”、“条件格式”、“突出显示单元格规则”、“重复值”)、数据透视表。(2)缺失数据处理:定位输入(“开始”、“编辑”、“定位条件”)、用一个样本统计量代替缺失值、用一个统计模型算出来的值进行替换、将有缺失值记录删去、将有缺失值的记录值保留但在不相应分析中做必要排除。(3)检查数据逻辑错误:IF函数、条件格式标记错误。

4.数据抽取:字段分列、字段合并、字段匹配。

5.数据转换:行列互换(选择性粘贴),多选录入方式转换。

6.数据分析方法:对比分析法(与目标对比、不同时期对对比、同级部门单位地区对比、业内对比、活动效果对比);分组分析方法;结构分析法(分析总体内的各部分与总体之间进行对比的分析方法,即总体内各部分占总体的比例);平均分析法(运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平);交叉平均法(通常用于分析两个变量之间的关系)。

你可能感兴趣的:(学习笔记,数据分析)