python机器学习库sklearn——特征选择

全栈工程师开发手册 (作者:栾鹏)

python数据挖掘系列教程

移除低方差特征

VarianceThreshold 是特征选择的一个简单基本方法,它会移除所有那些方差不满足一些阈值的特征。默认情况下,它将会移除所有的零方差特征,即那些在所有的样本上的取值均不变的特征。

# ============去除方差小于阈值的特征============
from sklearn.feature_selection import VarianceThreshold  #移除低方差特征
from sklearn.datasets import load_iris  # 引入花卉数据集
iris = load_iris()
X= iris.data
print(X.shape)
print(X.var(axis=0))

sel = VarianceThreshold(threshold=0.2)
X_transformed=sel.fit_transform(X)
print('去除低方差特征:\n',

你可能感兴趣的:(机器学习系列课程,快速学习实战应用,python系列课程,快速学习实战应用)