# -*- coding: utf-8 -*-
"""
@author: cheng
"""
#-*- coding: utf-8 -*-
#主成分分析 降维
import pandas as pd
#参数初始化
inputfile = 'H:/.../data/principal_component.xls'
outputfile = 'H:/.../data/dimention_reducted.xls' #降维后的数据
data = pd.read_excel(inputfile, header = None) #读入数据
from sklearn.decomposition import PCA
pca = PCA()
pca.fit(data)
pca.components_ #返回模型的各个特征向量
pca.explained_variance_ratio_ #返回各个成分各自的方差百分比
#选取前三个主成分,累计贡献率超过90%,选取三个就可以了
pca = PCA(3)
pca.fit(data)
low_d=pca.transform(data)
pd.DataFrame(low_d).to_excel(outputfile)#写入本地
pca.inverse_transform(low_d)