数据挖掘技术理论· 简谈

数据挖掘的技术与方法

·数据挖掘模型主要分为两大类

>描述性(无监督学习)

>预测性(有监督学习,分类模型)

描述性:分析具有多个属性的数据集,找出潜在的模式,没有因变量。

场景:观察个体之间的相似程度,例如根据年龄,性别,收入等因素对客户进行细分,根据客户对多个产品的购买,发现产品之间的相关性。主要算法有:聚类,因子分析,主要成分分析,对应分析。

预测性:用一个或多个自变量预测因变量的值。

场景:客户是否违约是一个因变量,可以用客户的年龄,性别,收入,职位等级,经济状况,历史信用状况等因素进行预测。主要算法有:决策树,线性回归,Logistic回归,支持向量机,神经网络,判别分析...


数据挖掘算法(按分析目的)

①预测

用过去的数据,预测未来发生什么。

②描述

用过去的数据,描述未来发生什么。













你可能感兴趣的:(数据挖掘技术理论· 简谈)