无监督学习PCA降维处理和K-means聚类

1、无监督学习

没有目标值(变量)的算法

常见的无监督学习算法:

降维:

– 主成分分析PCA降维处理

聚类:

– K-means(k均值聚类)

2、主成分分析

应用PCA实现特征的降维

·定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量

·作用:是数据维散压缩,尽可能降低原数据的维数(复杂度),损失少量信息。

·应用:回归分析或者聚类分析当中

PCA的APA:

·sklearn.decomposition.PCA(n_components=None)
- 将数据分解为较低维数空间

  • n_components:
    ·小数:表示保留百分之多少的信息
    ·整数:减少到多少特征变量
  • PCA.fit_transform(X) X:numpy array格式的数据[n_samples,n_features]
  • 返回值:转换后指定维度的array
'''#构造一组特征值数据'''
import numpy as

你可能感兴趣的:(python机器学习,PCA降维,K-means,无监督学习,python)