Product Sparse Coding

这是CVPR_2014的一篇文章关于sparse coding的文章。上午有同学做了这篇文章的报告,在此做个小笔记。这篇小博客只是做个小总结,要看细节部分请参考原文。

一、文章的作者

         Tiezheng Ge、 Kaiming He 和Jian Sun。一作是香港科技大学的,二作和三作是微软研究院的大牛。其中,Kaiming He 是2009CVPR  best paper的获得者,他当时的一篇关于去雾的文章可以称得上轰动一时。

二、文章的动机

         试图将一个版本表示为两个子码本的笛卡尔积,如一个128维的SIFT码本可以表示为两个54维SIFT码本的笛卡尔积。因此,学习码本的问题可以分解为学习两个子码本的子问题。如要学习一个具有10000个128维SIFT单词的码本,在理想的情况下,我们只需学习100+100=200个码本。也就是说,作者试图通过将码本表示为子码本的笛卡尔积,加速码本的学习。

三、文章内容的简单介绍



VQ、PQ、SC和PSC

       作者在文中给了一个示意图,很生动地给出了VQ、PQ、SC和PSC的区别与联系。如图,每张图中都有16个代表单词的绿色圆点以及一个代表样本点的红色三角点。VQ是将样本用最接近的某一个单词表示。SC是用少数几个单词线性表示一个样本。PQ和PS将码本空间表示为两个子码本空间的笛卡尔积,其中各有4个单词,即码本的单词数目为4×4=16。PQ是将样本用码本空间中最接近的某一个单词表示样本。PSC是用码本空间中的若干个样本线性表示样本。

将spase coding 问题转换为两个子问题

      经过一系列比较严密的公式推导,作者将码本空间spase coding 问题:

Product Sparse Coding_第1张图片

转换为子码本空间的spase coding 问题:

Product Sparse Coding_第2张图片

其中

算法流程

在字典固定的情况下,求线性表示系数的流程如下




文章及下载链接


你可能感兴趣的:(coding,product,sparse,PSC,VQ,spase,Codin)