2018-12-24监管式 vs. 无监管式学习

预测模型中的算法通常可以分为两类:即监管式模型算法和非监管式模型算法。在监管式模型算法中,控制变量为目标变量,其输出值是基于数据整体而实现的。而输出的这一变量可作为任务发起问题的答案,在监管式学习的模型逻辑下,这一输出值在模型的运作过程中很可能是未知的。监管式学习模型也被称之为预测性模型。而在主流的预测性算法模型中,经典的分类又包括绝对性的目标变量或者渐进式的目标变量。


需要进行目标决策的例子包括:顾客对于商品购买的决策、对商品购买数量的决策以及判断一桩交易的真实性决策、是否需要进入电影院进行消费的决策、两个捐献人进行捐赠的间隔日期决策、贷款是否需要违约的决策或者判断一件产品是否具有市场前景的预测。如果在一份记录中目标变量没有足够多的具有相关性的数据进行支持,那么模型将无法成立。


无监管式学习有时候也被称之为描述性模型,这一过程无需目标变量。在建模过程中,数据经分析后按照相关性被归入不同的数组。其中每一个数组都会分配一个标签对其进行描述。在诸如客户分析这样的应用案例中,无监管式学习也通常被称为割裂学习,因为模型在发挥功能的过程中对数据进行了不同维度的割裂和标签分组。


进行监管式学习的关键在于,模型的输入值是已知的,但是应用变量的应用环境是未经调查甚至是不可知的。在这些模型中常见的目标变量可能是一个事件、一项决策或者是先于观测出现的一些行为。应答模型、交叉模型以及增销模型均是采用这种原理进行工作的:即通过对输入客户类群的一些已知值,从而判断他们有可能在将来购买某一种特殊产品的可能性。


一些有关于应用性算法的定义偏重于算法功能方面,例如对未来事件或是未来行为的预测。这一记录的模式通常是一个案例,但是算法本身并不是一个案例。而目标变量实际上可以看作是一个未知值,例如一个缺失值。比如一个纳税人如果没有提交前一年的收入,那么在这种情况下也可以利用预测模型基于其他已知的相关证据对税务收入这一缺失值进行预测。

你可能感兴趣的:(2018-12-24监管式 vs. 无监管式学习)