多元统计分析:(一)概述

系列内容为笔者结合R语言学习多元统计分析的笔记。的markdown编辑器方便易用,节省了大量排版、格式修改的时间。
课程网址为:https://www.icourse163.org/course/XMU-1206305809#/info

STRCTURE
1.定义
2.方法简介
3.应用领域

1.定义

2.方法简介

2.1数据描述:ch2

2.2统计推断:ch4

2.3 经典降维:简化数据结构,ch6,7

用少数几个变量代替原有的数目庞大的变量,把重复的信息合并起来,既可以降低现有变量的维度,又不会丢失掉重要信息的思想,就称为降维。经典降维方法包括主成分分析 (Principal component analysis, PCA) 和因子分析(Factor analysis)

  • 主成分分析主要用于构造“综合指标”,以将原始数据最大程度地区分开
  • 因子分析旨在用一个变量(公因子)代替原始高度相关的某几个变量


    降维图解

2.4 目标归类:根据数据特征构造归类模式,ch5,8

  • 有监督学习范畴的分类问题(classification):用历史数据寻找分类规则,即判别分析(Discrimination),将新个体按照分类规则归至某一类(Classification)
  • 无监督学习范畴的聚类分析(clustering):定义刻画多元数据相似性/差异性的距离(Distance), 将“相似”的个体聚在一起作为一类(Cluster)

3.应用领域

John Tukey:The best thing about being a statistician is that you get to play in everyone else's backyard.


以实践生活中的营销为例,多元分析可以帮到我们什么?

  • 预测新的购买趋势:建立模型,预测未知值
  • 锁定忠实客户:分类问题
  • 发掘潜在顾客:分类问题
  • 精准营销、市场细分:聚类问题

多元分析的数据分析路线

你可能感兴趣的:(多元统计分析:(一)概述)