Matrix_11

论文解读：Unprocessing Images for Learned Raw Denoising

Unprocessing Images for Learned Raw Denoising

今天介绍谷歌发表在 2019 CVPR 上的一篇文章，Unprocessing Images for Learned Raw Denoising，这篇文章主要为了解决数据构造的问题，简单来说，就是将 ISP 的流程逆过来，从 sRGB 图像变到 RAW 图，然后进行模型训练，从而达到降噪的过程。

我们都知道，基于机器学习的图像处理技术，比如降噪，超分等，对数据的分布比较敏感，如果测试数据和训练数据的分布类似，那么效果会很理想，反之，如果测试数据的分布和训练数据差别比较大，那么效果就会出现差异，所以，现在基于深度学习的图像处理技术，对数据的构造是非常重要的一个环节，一个模型好不好，很多时候，依赖于训练数据的质量。文章也指出，很多 paper 由于只训练了理想的数据，或者说和实际环境偏差很大的数据，往往导致这样的模型，遇到实际场景的时候，不能很好的 work。

这篇文章主要讲去噪，在深度学习成为越来越主流的今天，这篇文章也不能免俗，不过这篇文章的重点不在于讲如何构造网络模型，这篇文章的重点在于介绍如何构造符合实际环境的训练数据，之前的方法，都是直接对 RGB 图像进行加噪，然后训练模型，这篇文章，不仅仅对 RGB 图像进行噪声模拟，而是对全 ISP 通路进行了分析，然后将 RGB 图像，沿着逆 ISP 通路，直接生成 RAW 图，文章作者指出，这样构造的训练数据，更加贴近真实场景拍摄的数据，利用这些数据训练的模型，会得到更好的降噪效果。

RAW Image Pipeline

现在的手机或者单反，都力图在图像中将真实世界还原地和人眼感知的一样，为了达到这个目的，需要将 sensor 获取的 RAW 图，进行一系列的变化处理，这个过程一般称为 ISP，这篇文章也是对 ISP 中的每个流程进行分析，并且力图找到每个变换的逆变换，如果从 RAW 图到最终的 RGB 图的每一步变换都已知，那么理论上来说，应该存在一个相应的逆变换，能将 RGB 图变换回 RAW 图，这样就达到了将 RGB 图构造成相应的 RAW 图，从而进行训练网络训练的目的。

Shot and Read Noise

首先，降噪一般来说在 ISP 中都是比较重要的一个环节，降噪的前提是对噪声模型要有一个准确的估计，虽然说图像中的噪声模型一般是比较复杂，但是在 RAW 域中，噪声的分布还是有规律可循的，噪声在 RAW 域中主要有两大类，一类是 shot noise, 一类是 read noise，shot noise 主要和环境光照有关，read noise 主要和 sensor 中的电路系统有关，shot noise 一般是满足泊松分布的，而 read noise 一般是满足高斯分布的，这篇文章将这两种噪声结合在一起，并且假设 RAW 图的像素值满足如下的分布：

$\sim \mathcal{N}(\mu = x, \sigma^2 = \lambda_{read} + \lambda_{shot}x)$

其中，参数 $\lambda_{read}, \lambda_{shot}$ 由 sensor 的数字增益和模拟增益决定，对于给定的数字增益 $g_d$ 和模拟增益 $g_a$ ，以及固定的 sensor 读出电路的方差 $\sigma_{r}^2$ ，我们可以得到如下的关系：

$\lambda_{read} = g_{d}^2 \sigma_{r}^2 \quad \lambda_{shot} = g_d g_a$

数字增益和模拟增益，一般是由 ISO 以及用户选择的曝光参数来确定的。

构造数据的时候，需要选择参数来模拟噪声，这篇文章将参数 $\lambda_{read}, \lambda_{shot}$ 写成某种分布的形式，

$\log(\lambda_{shot}) \sim \mathcal{U}(a=\log(0.0001), b=\log(0.012)) \\ \log(\lambda_{read}) | \log(\lambda_{shot}) \sim \mathcal{N} (\mu = 2.18 \log(\lambda_{shot}) + 1.2, \sigma = 2.6 )$

从上面的分布中，抽取参数，进而构造噪声。

Demosaicing

ISP 流程中，去马赛克也是一个重要环节，因为绝大多数的 sensor 都是 Bayer 模式的，所以每个像素在 RAW 图上只有一个通道，一般来说，是按照 R, G, G, B 的方式排列，为了得到彩色图像，需要对 RAW 图进行去马赛克的操作，所以马赛克的逆操作，就是一个降采样的过程，这个相对来说比较简单，就是对每个通道进行降采样。

Digital Gain

ISP 中，会有一个数字增益，对整体的图像亮度乘以一个 gain 值，以提升图像的整体亮度，这个增益在不同的相机 ISP 中，值会不一样，很难找到普适规律，文章作者认为可以寻找一个全局的 scale 值来代替这个 gain 值，假设图像的像素值服从如下的指数分布：

$\lambda) = \lambda e^{-\lambda x}$

对 $\lambda$ 的最大似然估计，就等于样本均值的倒数，文章统计了一些数据集，定下了一个 gain 值为 1.25，那么其倒数为 0.8，不过为了体现一定的鲁棒性，文章没有用一个定值，而是利用了一个高斯分布，均值为 0.8，方差为 0.1，对这个分布进行采样，最后得到的 scale 值范围在 $[0.5, 1.1]$ 之间。

White Balance

白平衡也是 ISP 流程中比较重要的一个环节，sensor 记录的是环境的照度，人类视觉经过漫长的进化，对环境的光线感知有一套自己的适应系统，为了让最后的成像能符合人眼的感知，一般需要做一个白平衡校正，简单来说就是 R,G,B 三个通道分别乘以不同的 gain 值，不过一般 G 通道 gain 值为 1，所以主要是看R,B 通道的概念值，一般相机系统的白平衡也是很难估计的，这为构造数据也带来了调整，不过文章提到所用的数据库记录了白平衡的 gain 值，文章用到的数据库，其 R 通道的gain值范围是 $[1.9, 2.4]$ ，B 通道的 gain 值是 $[1.5, 1.9]$ ，构造数据的时候，从 digital gain 和白平衡 gain 值进行采样，将两者的乘积作为逆向变换的系数，不过作者发现，这样设置的参数一般乘积都小于 1，这样导致构造的数据都是不饱和的，不符合实际，文章作者构造了一个函数，以模拟饱和截断，

$\alpha(x) = \left( \frac{\max(x-t, 0)}{1-t} \right)^2 \\ f(x, g) = \max \left( \frac{x}{g}, (1-\alpha(x))(\frac{x}{g}) + \alpha(x)x \right)$

其中 $t = 0.9$ ，从上式可以看到，当 $ x \leq t $ 的时候， $\frac{x}{g}$ ，当 $x = 1$ 的时候， $f (1, g) = 1$

Color Correction

色彩校正，就是将 RAW-RGB 变成 sRGB 的过程，一般都是通过一个 $\times 3$ 的矩阵来实现的，文章也是基于数据库提供的 CCM 来实现的。

Gamma Compression

gamma 校正，就是一个非线性的变换的过程，因为人眼视觉对暗区的对比度变化比较敏感，所以一般会有一个对暗区像素提升的过程，文章里用到的 gamma 变换是一个标准的变换式：

$\Gamma(x) = \max(x, \epsilon )^{1/2.2}$

那么构造训练数据，就是应用一个反变换：

$\Gamma^{-1}(y) = \max(y, \epsilon)^{2.2}$

Tone Mapping

tone mapping 算法，就是进一步调整图像的对比度，一般 ISP 里面，都会用到比较复杂的 tone mapping 算法，这篇文章做了一个简单 tone mapping 算法，其逆变换也会相对简单：

$3x^2 - 2x^3 \\ S^{-1}(y) = \frac{1}{2} - \sin \left( \frac{\sin^{-1}(1 - 2y)}{3} \right)$

到这一步的时候，ISP 里面的主要步骤都已经做了，那么构造数据的时候，就是将上面的过程反过来走一遍，如下图所示：

文章指出，由于 RAW 图最终要经过 ISP 得到 sRGB 图像，所以 RAW 图经过降噪之后，也会经过 ISP，最终才和 ground truth 的 sRGB 进行比较，简单来说，这个模型不是在 RAW 域进行比较的，而是在 sRGB 域进行 loss 比较的。

RAW 域的降噪模型是典型的 U 型网络结构，不过输入除了 RAW 图的四个通道之外，还带有噪声估计的图，如下所示：

文章里面提到，用到的是 MIR Flickr extended dataset，预留了 5% 做 validation，5% 做 test，剩下的都用来训练了，为了减少其它的 artifacts，文章对图像先做了一个高斯模糊加 2X 的下采样，然后再进行数据的构造。

最后作者也在 Github 上发布了自己的仿真代码，有兴趣的可以去看看：

https://github.com/google-research/google-research/tree/master/unprocessing

[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f