sklearn的lda降维

LDA全称:线性判别分析
用途:用来对数据进行降维或分类
目标:LDA关注的是能够最大化类间区分样本
将特征空间(数据集中的多维样本)投影到一个维度更小的K子维样本中,同时保持区分类别的信息。
sklearn的lda降维_第1张图片
降维算法的画图解释。
LDA更关心的是投影后的分类。而PCA更关系新的是投影后的方差,意思就是说LDA分类的目标是使得不同类别之间的距离越远越好,同一类别之间的距离越近越好。
目的:就是找到一个Y=WTX T是转置矩阵的意思
找到一个它使得投影后的点,不同类距离最远,同类距离最近。

sklearn代码:

from sklearn import datasets  
iris=datasets.load_iris()
#导入鸢尾花数据集
iris_x=iris.data 
#导入数据,数据是个矩阵
#knn算法中x是数据,是一个二维数组,横着的是数据个数,列表示数据的东西
y = iris.target
iris_x
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
lda = LDA(n_components=2)#设置转换后的维度
new_x = lda.fit_transform(iris_x,y)
new_x

你可能感兴趣的:(sklearn的lda降维)