scikit-learn:2.5.矩阵因子分解问题

http://scikit-learn.org/stable/modules/decomposition.html#lsa



2.5.1:PCA

标准PCA:只支持批量处理

incremental PCA:支持分批处理,对于内存容不下的情况很好

Approximate PCA:RandomizedPCA 通过computation to an approximated estimate(而非确切的) of the singular vectors,减少运行时间、存储空间。

Kernel PCA:通过使用核,达到非线性维度缩减(achieves non-linear dimensionality reduction through the use of kernels)。

SparsePCA and MiniBatchSparsePCA:faster but less accurate. The increased speed is reached by iterating over small chunks of the set of features, for a given number of iterations.


2.5.2:Truncated singular value decomposition and latent semantic analysis(截断SVD和LSA/LSA)

先说明:latent semantic indexing, LSI和latent semantic analysis, LSA本质一样。

TruncatedSVD是SVD的变形,只计算用户指定的最大的K,个奇异值。

具体内容参考我的这篇文章吧:

http://blog.csdn.net/mmc2015/article/details/46867773








你可能感兴趣的:(pca,scikit-learn,矩阵因子分解)