建模杂谈系列4-预测模型分类

说明

预测模型的价值不用赘复,本篇探讨预测模型的类型以及其作用机制。
预测模型大致可以分为三类:

  • 1 高维模型
  • 2 时间约束模型
  • 3 空间约束模型

以下就这三类预测模型进行简单的探讨。

内容

1 高维模型(HDPM,High Dimension Prediction Model)

常见的逻辑回归、决策树、XGBOOST都可以归于此类模型。此类模型的特点是不考虑时间和空间的变化。
此类模型的本质是Lookalike分析,寻找样本之间固有的属性特质,从而预测样本发生事件的概率。
如果用于精准营销,那么就是找到购买特质相似的客户,从而获得更高的营销概率;如果用于风险控制,那么就是找到风险特质相似的用于,发现更容易违约的客户。

与人比较, HDPM的优势是高维空间(人只能在低维空间有效决策)与量化(人习惯于定性分析)

2 时间约束模型(TCPM, Time-Constraint Prediction Model)

最常见的是时间序列模型,例如ARIMA,LSTM,HMM这些。此类模型考虑的是维度随时间变化的趋势。
此类模型的本质是趋势(或者说惯性)分析,寻找样本自身发展的方向,从而做出预测。这种模型本身的动力来自于主观,发自内部。
时间约束模型通常可以进行类似价格预测,销量预测,购买习惯分析等,但坦白来说,一旦涉及到时间的问题,通常就会变得比较难。

目前并没有很好(成熟)的时间模型框架。

3 空间约束模型(SCPM, Space-Constraint Prediction Model)

最常见的空间约束有图像识别模型(CNN算半个吧),图模型等。此类模型考虑的是维度随空间约束变化的趋势。
此类的模型本质是互动(力的作用是相互的)、势(人往高处走,水往低处流)的分析。这种模型的动力来自于客观,发自外部。

目前并没有很好(成熟)的空间模型框架。

结语

建模的复杂之处在于:决定事物未来发展结果的原因是有多样的,既有事物的当前状态(HDPM), 也有事物本身的惯性(TCPM), 还要考虑当前的外部形势(SCPM)。这个难度是乘数效应估计的。
即便是短期内主要由某个方面决定,你也需要准备三套模型。并且如果考虑了博弈情况,预测问题将指数倍的难。

你可能感兴趣的:(建模,python)