特征选择 | MATLAB实现特征变量相关性分析(Pearson相关系数,Kendall相关系数和Spearman相关系数)

特征选择 | MATLAB实现特征变量相关性分析(Pearson相关系数,Kendall相关系数和Spearman相关系数)

目录

    • 特征选择 | MATLAB实现特征变量相关性分析(Pearson相关系数,Kendall相关系数和Spearman相关系数)
      • 基本介绍
      • 原理描述
      • 程序设计
      • 学习总结

基本介绍

相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。相关性分析是很常用的方法。在分析指标与指标、指标与研究对象的影响程度时,很多时候会用到相关系数法,常见的三种:Pearson相关系数,Kendall相关系数和Spearman相关系数。在这三大相关系数中,spearman和kendall属于等级相关系数亦称为“秩相关系数”,是反映等级相关程度的统计分析指标。最终选择哪种相关系数法,对比结果谁更符合预期效果。

原理描述

  • Pearson线性相关系数:
    Pearson 线性相关系数是最常用的线性相关系数。最适用数据的形式:线性数据、连续且符合正态分布、数据间差异不能太大。

你可能感兴趣的:(#,XGBoost极限梯度提升树,特征选择,组合调参,数据挖掘,模型评估,相关分析)