“接着上一篇的内容,这篇主要讲在PPT中提到的几种分析方法以及每种方法的实现方式”
每一种分析方法都有整理好的案例介绍(在传送链接里,附python实现代码),先马后看。
几种主要的分析方法汇总如下:
种类 |
功能 |
算法 |
典型应用 |
分类 回归 |
分类 |
决策树、神经网络分类、区别分析、逻辑回归、概率回归 |
风险分析、客户挽留分析、欺诈探测 |
回归 |
线性回归、非线性回归 |
收益率分析,收入预测,信用价值预测,客户潜在价值预测 |
|
聚类 |
集群分析 |
K-平均值,神经网络聚类 |
客户分割 |
关联 规则 |
关联分析 |
统计学,集合理论 |
交叉销售。捆绑销售 |
序列关联分析 |
统计学,集合理论 |
交叉销售 |
|
相似时间序列分析 |
统计学,集合理论 |
产品生命周期 |
|
时序 模型 |
时间序列预测 |
统计时间序列模型、神经网络 |
销售预测、利率预测、损失预测 |
分类模型和回归模型本质一样,分类模型是将回归模型的输出离散化。
"talk is cheap, show you the code"
一定不能少的三个模型:
逻辑回归,决策树,支持向量机
逻辑回归
Logistic 回归算法基于 Sigmoid 函数,或者说 Sigmoid 就是逻辑回归函数。
其函数曲线如下:
逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某信用卡用户发生逾期的可能性。
决策树
决策树对于单调的特征变换是”indifferent”的,也就是说特征的单调变换对于决策树来说不会产生任何影响.优势:
支持向量机
SVM最大的好处就是它只依赖于处于分类边界的样本来构建分类面,可以处理非线性的特征,优势:
逻辑回归,决策树,支持向量机三个模型的详细介绍:
| 作者Info:
【作者】:A字头
【原创公众号】:数据札记倌(Data_Groom)
【简介】:这是一个坚持原创的技术公众号,每天坚持推送各种 Python基础/进阶文章,数据分析,爬虫实战,机器学习算法,不定期分享各类学习资源。
【福利】:送你新人大礼包一份,关注微信公众号,后台回复:“CSDN” 即可获取!