数据挖掘与数据分析(三)—— 探索性数据分析EDA(多因子与复合分析) & 可视化(2)——回归分析(最小二乘法&决定系数&残差不相关)&主成分分析&奇异值分解
回归分析回归分析确定两种或两种以上变量之间的相互依赖的定量关系的方法线性回归最常见的解法就是最小二乘法线性回归效果的度量主要有两种:决定系数和残差不相关决定系数越接近于1,回归效果越好;越接近于0,回归效果越差右边的式子是多元线性回归的主成分分析PCA主成分分析最重要的作用就是降维例如这张表中,可以把表看作一个空间,每条数据都是空间中的一个向量。表中有4个属性,每个属性都是一个维度,每个向量都有4