特征工程:降维

文章目录

  • 一、什么是降维?
  • 二、降维的两种方法
    • 1、特征选择
      • ①Filter过滤式
        • 主成分分析:
      • ②嵌入式

一、什么是降维?

降维是指在某些限定的条件下,降低随机变量(特征)个数,得到一组不相关主变量的过程。
效果:特征与特征之间不相关

二、降维的两种方法

1、特征选择

数据中包含冗余或相关变量,皆在从原有特征中找出主要特征

①Filter过滤式

  • 方差选择法
    API: sklearn.feature_selection.VarianceThreshold(threshold=0.0)
    返回值:训练集差异低于threshold特征值的将会被删除,默认值是保留所有非零特征值
    代码实现:
impor

你可能感兴趣的:(人工智能+大数据,python,机器学习,sklearn)