【Sklearn】基于线性判别法的数据分类预测(Excel可直接替换数据)

【Sklearn】基于线性判别法的数据分类预测(Excel可直接替换数据)

  • 1.模型原理
  • 2.模型参数
  • 3.文件结构
  • 4.Excel数据
  • 5.下载地址
  • 6.完整代码
  • 7.运行结果

1.模型原理

线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的模式识别和分类方法,它的目标是找到一个投影,将数据投影到低维空间,使得不同类别的样本在投影后的空间中有最大的类别间距,同时最小化类内方差。

模型原理如下:

  1. 假设有d维的数据,分为K个类别。我们的目标是找到一个投影方向(一个长度为d的权重向量w),使得在这个方向上的投影可以最大化类别间的差异,最小化类内的方差。

  2. 定义类内散度矩阵(Within-Class Scatter Matrix)Sw和类间散度矩阵(Between-Class Scatter Matrix)Sb:

    • 类内散度矩阵Sw表示各个类别内部数据的分散程度,计算方法是每个类别的数据与其类别均值的差的协方差之和。
    • 类间散度矩阵Sb表示不同类别之间的数据分散程度,计算方法是各个类别均值与总体均值的差的协方差加权和。

你可能感兴趣的:(#,sklearn模型,sklearn,分类,excel)