deepar,传统概率模型如何和深度学习结合的?

由于是在不会打公式,所以只能白话说下自己的认识.
深度学习和统计领域一些知识的结合,比如条件随机场crf,再比如这个deepar,都是在损失函数上做文章.

deepar预测的不是数据本身,而是数据分布的参数.比如模型预测出价格时间序列的均值和方差,假设分布是正态分布,那么损失函数怎么构造了? deepar预测的不是一个时间点,比如预测7天,那么每天都会预测出一个均值和方差, 这一共就是7组模型参数,我们需要:在每组参数条件下,给定实际价格出现概率最大,也就是给定7组参数,7个正态分布连乘概率最大(似然函数). 那么损失函数就是对这个似然函数取负log,损失函数最小就好.

把这个损失函数放到seq2seq的模型中,就是deepar的主干框架思想脉络.,确实结合的很巧妙. 并没有太多新东西,但是可以让seq2seq的预测可以和置信区间这些统计概念结合,从而实用度更高,而不是简单算命.

你可能感兴趣的:(深度学习,人工智能)