四.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析

以下是SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析的第四部分,用IBM SPSS 对关联大数据平台帆软finebi获取的数据源进行分类算法处理。

1.编程基础

数据挖掘需要一定的编程基础,因为要实现模型以及数据的处理很多工作都是需要程序来进行的,数据挖掘常用的编程语言如下: 

SQL:数据库的熟练使用是任何数据挖掘人员必不可少的技能。 

C++ :有很多的标准模板库以及机器学习模型库进行调用可以方便编程实现。 

Python:对字符串处理有极大的优势,是解释型语言,实现简单,而且有很多开源的机器学习模型库的支持,可处理大规模数据。 

Matlab:拥有强大的矩阵运算,也是解释型语言,有很多发展较成熟库可以直接调用,支持数据结果的可视化表示,但是处理数据量有限。 

R:近年兴起的数据分析编程语言,数据可视化做的比较好,语法简单,学习成本很低,很多非程序设计人员都可以数量掌握。 

Java:使用范围最广的编程语言,有很多社区进行交流,进行编程实现具有灵活高效的特点,不足之处就是实现功能的代码量较大(相对于其他数据挖掘编程语言)。 

Scala: 一种具有面向对象风格、函数式风格、更高层的并发模型的编程语言。同时Scala是大数据处理平台Spark的实现语言。

2.数据处理基于决策树分析亏损顾客特征

2.1基于决策树分析亏损顾客特征的数据挖掘流

四.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析_第1张图片

2.2数据预处理

1.导入数据源,筛选数据

四.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析_第2张图片

导入数据源后,在SPSS Modeler加入“选择”节点,并设置“收益>=0”的条件,这样就可以获得购买理财产品后亏损的顾客数据。

2.导出字段:亏损程度

四.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析_第3张图片

加入“导出”节点,根据收益的四个区间设置四个不同的值“轻度亏损”、“中度亏损”、“重度亏损”、“严重亏损”,导出字段。

3.过滤数据并设置数据类型

四.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析_第4张图片

左图为“过滤”节点的设置:由于目标变量为“亏损程度”,而“收益”这一变量直接影响目标变量,所以我们首先要过滤掉“收益”这一变量。

右图为“类型”节点的设置:将“亏损程度”设置为目标变量,其他变量设置为输入变量。

以上就是通过IBM SPSS对帆软关联大数据平台获取的理财产品顾客数据的数据挖掘,对数据进行分类算法设置。后面用帆软finebi实现数据可视化分析,导出图表,实现帆软仪表板规划设计,展现基于分类算法的理财产品顾客亏损及收益分析。

你可能感兴趣的:(finebi,分类,数据挖掘)