首先图像是一个二维的结构,CNN提取图片的特征,但是是local的,通过kenel的形式,不断的图上移动,通过卷积的形式,
无论移动到哪个位置,内部的结构都是不变的,这就是参数共享.
这个所说的图像显然都是欧式空间的,满足欧几里得空间的线性空间的几个重要的性质. 具有数据结构的规则性属性,但是在实际中,
存在许多的图结构的数据,社交网络等.
Point 1
泛化到ID task, 由于non-local 方法的非常好的效果,such as BM3D, NL-Means 等方法,同时,尽管现在的sota方法--如CNN-based discriminative 方法,
such as DnCNN, 还是GAN-based的对抗学习方法,都是基于CNN-based的方法,继承了CNN-based的天然属性,locol propertise, 参数共享带来的
计算的高效等, 但是 现在的SOTA方法其实都在 想方设法的 增加non-local 的components, 最典型的操作就是 增大感知野的一系列方法,such as
dilated conv的使用, 并行的对感知野的引入, 都在获取 pixel-wise 周围的更可能多的 information, 以实现对这个 pixel-wise 的恢复和估计.
Point 2
图网络, 如果应用到ID task 这种欧式空间, pixel-wise 其实就相当于是 一个 node, 我们需要利用 neighbor nodes 的 hidden feature 去 估计和 恢复 受到干扰的
这个节点的特征, 而图网络 具有的非欧式 特征, 通过neighbor nodes的信息传递, 能够 接收到 更大范围的 nodes(pixel) 信息, 这无疑是更为robust的,
同时 表现除了 non-local 属性, 效果提升是可以期望的.
Point 3
将objective function 定义为
$\mathcal{L}(\theta)=\frac{1}{2}\sum_{i=1}^{N}\|f(y;\theta)-(y-s)\|_{2}^{2},$