异构属性特征(连续型和分类型)选择

异构属性特征(连续型和分类型)选择

前言

这段时间试了各种各样的论文方法,复杂度、新颖度都考虑之后,觉得不适合新手使用,下面介绍一种使用SPSS软件进行特征选择的方法,其中包括了原理和操作步骤,供大家学习讨论。


一、SPSS软件介绍

异构属性特征(连续型和分类型)选择_第1张图片
IBM SPSS是目前常用的一种统计分析软件,SPSS(Statistical Product and Service Solutions)是统计产品和服务解决方案软件,操作简单,无需写代码,只需确定要分析数据的因变、自变关系,以及单因素、多因素、混合等分析即可。

SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。

对于SPSS下载不懂的小伙伴可以评论里告诉我。

二、案例分析

2.1数据理解

对于异构特征选择,本案例中是选择和并发症最相关的一些特征,因此因变量是二分类的变量,自变量为待选特征,包括了连续特征和分类(有序、无序)特征,需要考虑这样几个问题:

  1. 对分类变量之间的研究,卡方检验是常用的方法,但只是用卡方检验会遇到两个问题

你可能感兴趣的:(学习整理,数据挖掘,spss,逻辑回归,机器学习)