七.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析

接下来将用IBM spss对finebi获取理财产品顾客数据实现分类算法数据挖掘,第七部分讲基于决策树分析不同收益顾客特征。

1.知识准备

1.1ogistic回归用spss做最佳。spss和spss modeler的区别如下:

1、spss modeler是数据挖掘,spss是统计分析:spss是一款用于处理常见统计问题的软件,功能是比较齐全的。spss modeler是专门用于做数据挖掘的软件,包含各种数据挖掘算法,可以和其他数据库软件比较好地兼容、连接。

七.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析_第1张图片

2、直接区别:两者在处理数据的量上有区别,spss的处理数据量有限,而spss modeler处理数据的量可以是海量,也就是现在所说的大数据。

3、本质区别:主要是功能上的,spss modeler包括有统计分析的部分,也有机器学习和人工智能的部分,而spss主要就是统计分析,是以统计学的理论为主的。spss modeler更侧重挖掘潜在的知识,为业务做指导,spss侧重在统计分析功能的应用。

1.2 spss和spss modeler的功能介绍:

1、结果报告:从10版起,对数据和结果的图表呈现功能一直是SPSS改进的重点。在16版中,SPSS推出了全新的常规图功能,报表功能也达到了比较完善的地步。13版将针对使用中出现的一些问题,以及用户的需求对图表功能作进一步的改善。

2、统计建模:Complex Samples是12版中新增的模块,用于实现复杂抽样的设计方案,以及对相应的数据进行描述。但当时并未提供统计建模功能。在13版中,这将会有很大的改观。

一般线形模型将会被完整地引入复杂抽样模块中,以实现对复杂抽样研究中各种连续性变量的建模预测功能,例如对市场调研中的客户满意度数据进行建模。

对于分类数据,Logistic回归则将会被系统的引入。这样,对于一个任意复杂的抽样研究,如多阶段分层整群抽样,或者更复杂的PPS抽样,研究者都可以在该模块中轻松的实现从抽样设计、统计描述到复杂统计建模以发现影响因素的整个分析过程。

方差分析模型、线形回归模型、Logistic回归模型等复杂的统计模型都可以加以使用,而操作方式将会和完全随机抽样数据的分析操作没有什么差别。可以预见,该模块的推出将会大大促进国内对复杂抽样时统计推断模型的正确应用。

3、模块:这个模块实际上就是将以前单独发行的SPSS AnswerTree软件整合进了SPSS平台。笔者几年前在自己的网站上介绍SPSS 11的新功能时,曾经很尖锐地指出SPSS的产品线过于分散。

应当把各种功能较单一的小软件,如AnswerTree、Sample Power等整合到SPSS等几个平台上去。看来SPSS公司也意识到了这一点,而AnswerTree就是在此背景下第一个被彻底整合的产品。

4、兼容性:随着自身产品线的不断完善,SPSS公司的产品体系已经日益完整,而不同产品间的互补和兼容性也在不断加以改进。

2.于决策树分析不同收益顾客特征

2.1 预测变量重要性

七.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析_第2张图片

分析属性重要性发现,“理财产品分类”和“学历”影响最大,其次是“选择本行原因”、“年龄”、“性别”、“购买金额”、“期限”、“购买目的”、“家庭年收入”

2.2 C5.0模型分析

七.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析_第3张图片

决策树模型反映的特征如下:

(1)理财产品选择“信托”的情况下,大多数客户倾向于过度盈利。

决策树模型反映的特征如下:

(2)理财产品选择了“信托”的情况下,家庭年收入此时对于购买理财产品收益的影响很大,不同家庭年收入水平顾客收益存在明显差异。

基于finebi获取资料:理财产品顾客分类数据分类。

实现数据可视化面板制作工具:帆软finebi。

数据挖掘工具:IBM SPSS。

你可能感兴趣的:(finebi,分类,数据挖掘,数据分析)