张量(三):张量鲁棒主成分分析(TRPCA)

 

基于张量分解,张量鲁棒主成分分析法(TRPCA)是对鲁棒主成分分析(RPCA)的高阶扩展,在数据去噪等领域拥有广泛应用。本篇将对TRPCA以及其最新的改进模型做出介绍。

目录

一、RPCA

二、TRPCA

三、TRPCA-TNN


一、RPCA

在实际应用中,很多数据矩阵往往是低秩或近似低秩的。理想状态下,数据矩阵的行与行之间应当具有极强的相似性,整个矩阵应当是低秩的。但由于数据噪声的存在,破坏了这种低秩性。因此,为了恢复矩阵的低秩结构,可将矩阵D分解为两个矩阵之和,即低秩矩阵A和稀疏矩阵E,D=A+E。低秩矩阵为分离了噪声的真实矩阵,稀疏矩阵为分离出的噪声矩阵。于是,RPCA问题可转化为如下的凸优化问题:

RPCA表达式

其中\left \| \cdot \right \|_{\ast }表示矩阵的核范数,\left \| \cdot \right \|_{1}表示矩阵数据的绝对值之和,\lambda是一个正的权重参数。该式的意思为在保证D=A+E的条件下,使A的核范数与E的L1范数之和最小。当实现最小时,则去噪的效果最优。

对凸优化问题的求解方法目前主要有迭代阈值法、加速近端梯度法、对偶法等,最常用的是增广拉格朗日乘子法(交替方向乘子法,ADMM)。其拉格朗日函数为:

拉格朗日函数

具体算法流程如下:

张量(三):张量鲁棒主成分分析(TRPCA)_第1张图片


二、TRPCA

Tensor Robust Principal Component(TRPCA)是对RPCA的高阶扩展,旨在从噪声数据中还原出真实的低秩张量。下图展示了TRPCA的过程:

张量(三):张量鲁棒主成分分析(TRPCA)_第2张图片

同样,TRPCA可转化为一个凸优化问题,如下式:

 

TRPCA表达式

该优化问题也使用ADMM去计算。


三、TRPCA-TNN

目前对TRPCA的改进方案主要集中于对低秩矩阵的核范数\left \|L \right \|_{\ast }的全新定义。TRPCA-TNN的核心在于定义了新的核范数tensor nuclear norm(TNN)。对一个张量A\in \mathbb{R}^{n_{1}\times n_{2}\times n_{3}},按t-SVD分解得A=U\ast S\ast V^{\ast },TNN定义为:

TNN定义式

其中\left \| A \right \|=\left \| bcirc\left ( A \right ) \right \|=\left \| \bar{A} \right \|定义为A的谱范数,bcirc()为块循环矩阵,详见张量(二)。经过公式推导可得换算关系:

TNN换算关系

由公式可知,块循环矩阵和傅里叶变换后的A均通过A的切片捕捉到了A的空间信息,这支持了核范数的定义。下图表明了TNN与张量其他相关概念的关系:

张量(三):张量鲁棒主成分分析(TRPCA)_第3张图片

由图可知,张量算子范数是算子范数在高阶领域的扩展。张量谱范数是由张量算子范数通过张量-张量积导出。张量核范数定义为张量谱范数的对偶范数。张量平均范数是张量核范数的凸包络。

TRPCA-TNN的ADMM计算算法如下:

张量(三):张量鲁棒主成分分析(TRPCA)_第4张图片

针对多幅视频图像应用TRPCA-TNN进行去噪,并以RPCA,SNN作为对比,结果如下:

张量(三):张量鲁棒主成分分析(TRPCA)_第5张图片

TRPCA的效果肉眼可见的好,以PSNR作为评价指标,定义为:

PSNR定义

通常PSNR作为去噪效果的评价指标,去噪结果可视化如下: 

张量(三):张量鲁棒主成分分析(TRPCA)_第6张图片

相比之下,TRPCA的去噪效果最好,运行耗时最短。

了解更多细节可参考:《Tensor Robust Principal Component Analysis with A New Tensor Nuclear Norm》

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(张量,大数据,矩阵,数据挖掘,深度学习,人工智能)