Python用主成分分析的方法分析螺纹钢期货30多个技术指标

#主成分分析 降维
import pandas as pd

#参数初始化
inputfile = 'C:/Users/Administrator/Desktop/rb000.xlsx'

data = pd.read_excel(inputfile) #读入数据
data=data.dropna()
data=data.loc[1:,::]
data.columns=list(range(len(data.columns)))
from sklearn.decomposition import PCA

pca = PCA()
pca.fit(data)
pca.components_ #返回模型的各个特征向量
ratio=pca.explained_variance_ratio_ #返回各个成分各自的方差百分比
ratio[0]

计算各个技术指标之后,返回方差百分比,发现第一个维度占比0.99999962739146842,无限接近于1.

据悉,方差百分比,也称为贡献率,越大,代表着权重越大,代表着对于这些变量的解释度越高。那么,是不是可以理解,其实有一个指标可以代表这30多个指标呢?其实绝大部分指标用处并不大?




你可能感兴趣的:(python)