分类模型(清风数模笔记)

一、二分类模型

1.logistic回归

用于解决因变量y为分类变量,例如(0-1)对于是否违约这种问题。

logistic回归的原理:logistic回归是一个二分类模型_识物专栏-CSDN博客_二分类logistic回归模型

在建模中的操作步骤

1.导入原始数据进SPSS

2.创建虚拟变量

比如说题目给出了前19个样本为苹果、后19个样本为香蕉,并且还给了每个样本的一些指标如:颜色、大小等等。要求我们对未知是苹果还是香蕉的后几个样本根据这些指标做出分类。

创建虚拟变量的意思是要定义苹果为1香蕉为0(反过来也可以)。

3.利用spss的logistic逻辑回归命令进行回归

在选项设置里,有个分类选项的意思是看看指标数据中是不是有定性的变量,比如性别指标,如果有的话就添加进去,参考类别是对照组的意思。

4.回归结果如果比较差,正确率低,那就可以加入平方项或者交互项

但是加上平方项或者交互项可能会使拟合结果太好,发生过拟合现象,这时候可以去通过添加训练组和测试组的方法,就把随意的几个样本变为测试组,把测试组的虚变量删掉,然后按原来的方法,加平方项和不加平方项对比,看看加平方项的成功率高多少,然后不断地变换测试组数,多次尝试后选择拟合效果最好的。

二、多分类模型

Fisher线性判别分析

原理较为复杂,核心思想是给一定的样本,设法将样本投影到一维的直线上,使同类样例的投影点尽可能紧密,异类尽可能远离

logistic多元回归分析也可以进行多分类回归

两个方法都在SPSS软件上可以直接求解。

你可能感兴趣的:(分类,机器学习,回归)