CortexNet: a Generic Network Family for Robust Visual Temporal Representations

动机:

前馈网络能够很好的训练静止图片的有监督任务,但是不一定适合视频数据。

利用人类视觉系统,构建了一个网络不仅可以bottom-up前向传播,还可以top-down反馈传播,以及侧向传播。

提出了两种训练机制:无监督的MatchNet和弱监督的TempoNet

网络通过学习运动线索以及如何在现在的场景自动追踪多个物体,学到如何预测接下来的帧或者识别当前帧的内容。

网络可以测量预测和真实帧的误差,如果没有很好的预测下一帧,可以激活增量学习(把误差传到下一帧预测中)

你可能感兴趣的:(CortexNet: a Generic Network Family for Robust Visual Temporal Representations)