数据分析的统计基础-大纲

1.数据分析步骤:
    明确分析目的和内容
数据收集
数据预处理
数据分析步骤
数据展现
报告撰写

2.数据分析软件优点比较:
    Spass:界面友好,输出结果美观
R:高效的数据处理及存储,擅长矩阵操作
Matlab:人机交互,提供了众多的应用函数
sas:统计分功能强大
3.数据分析方法:
   (1)单纯的数据加工方法
* 描述性统计分析:
集中趋势分析:平均数,中位数,众数
离中趋势分析:全跑,四分位跑,方差,标准差
数据分步分析:指和正态分布相比,直方图的形状
* 相关分析:
单一相关关系:
多重相关关系:
   (2)基于数理统计的数据分析方法
* 方差分析
* 回归分析
* 因子分析

   (3)基于数据挖掘的数据分析方法
* 聚类分析:将对象的集合分组成为类似对象的多个类
* 分类分析:
决策数
人工神经网络
贝叶斯分类方法
支持向量机
随机森林
* 关联规则:频繁模式和并发关系
* 回归分析:多元线性回归和逻辑斯蒂回归
(4)基于大数据的数据分析方法:
* Mahout:主题推荐,聚类和分类
* spark:内存
* storm:实时 

你可能感兴趣的:(CDA考试-初级)