Najlepszy

自动上色论文《Deep Exemplar-based Colorization》（2）

书接上文：https://blog.csdn.net/Najlepszy/article/details/85289496
回来填坑。
四、着色参考图片的推荐系统
正如前文所言，本文对参考图片的选择具有稳健性。为帮助用户发现更好的参考图片，我们提出一种新的图像检索方法，可自动为用户推荐良好的参考图片。此外，该方法通过Top-1候选法来产生全自动的系统。
全局排名：通过gray-VGG-19，我们还可以获得查询图像 $T_L$ 的Top 1 ID。根据类ID，我们将搜索域缩小到同一类的所有图像（大约1000个图像）。我们通过比较查询信息和所有候选者之间的f c特征来过滤不同的候选者。举例来说，查询信息可能是“在草地上奔跑的猫”，但候选图片可能是"坐在屋子里的猫"。然而我们希望这两张图片的语义信息尽可能越相像越好；为了实现这一点，对于该类中每个候选图片 $R_i$ (i=1,2,3,…),直接计算 $F_T^6$ 和 $F_{R_i}^6$ 的余弦相似性获得global score，并对这个global score进行排名。
局部排名：全局排名提供给我们前N个可选的图片 $R_i$ (N=200),而f c特征由于其会忽略空间信息，因此无法提供更为准确的信息。因此，我们在剩下的N张图片中进行一个局部的排序，来删除一些参考图片。
局部的一致性分数包括语义信息和照度信息。对于每个图片对 ${T_L,R_i\}$ ,在 $F_T^5$ 的任意像素p上，我们通过最小化 $F_T^5(p)$ 和 $F_{R_i}^5(q)$ 来获得最近邻的像素q，命名为q=NN§。因此，语义信息被定义为 $F_T^5(p)$ 和 $F_{R_i}^5(q)$
照度信息在像素p与q附近区域之间，我们把图片 $T_L$ 分解成有16x16分辨率的二维网格。每个网格经过四个下采样层对应着特征图 $F_T^5$ 的一个点。因此， $C_T(p)$ 是点p在特征图 $F_T^5$ 中点p对应的网格。同样， $C_{R_i}(q)$ 是特征图 $F_{R_i}^5(q)$ 中q点对应的网格。 $d_H(\cdot)$ 函数测量 $C_T(p)$ 和 $C_{R_i}(q)$ 的照度直方图之间的相关系数。
局部一致性分数如下所示：
$score(T,R_i)=\sum_p(d(F_T^5(p),F_{R_i}^5(q) + \beta d_H(C_T(p),C_{R_i}(q)))$ , $\beta$ 确定两个信息的相应权重。实验中， $\beta$ 设置为0.25。一致性分数为每个图片对 ${T_L,R_i}(i=1,2,3,...)$ 。通过全部的局部排名分数，我们重拍虚了全部可选图片并寻找排名靠前的图片。
我们通过PCA降维来加速计算能力。特征fc6的通道数由4096被压缩到128，特征relu5_4的通道数从512被压缩到64，并具有可忽略不计的影响。经过如上降维方式，我们的参考图片搜索算法可以实时运行了。
五、Discussion
通过消融研究，我们测试并证明了着色网络的性能。
问题一：着色子网络学习到了什么？
着色子网络 $\pmb{C}$ 根据目标和参考图片来学习如何选择，传播和预测颜色。如前所述，它是一个端到端网络，涉及两个分支，每个分支都扮演着不同的角色。首先，我们希望在学习过程中仅使用色度分支来理解网络的行为。为此，我们仅通过最小化色度损失来训练 $\pmb{C}$ 的色度分支，并在一个示例上对其进行评估以直观地理解其操作（图7）。
通过比较预测结果（第4列）的色度与对齐参考图片（第3列）的色度，我们注意到它们在大多数区域中具有一致的颜色（例如，“蓝色”天空，“白色”平面和“绿色”草坪）。这表明我们的Chrominance分支从参考图片中选取颜色样本，然后将它们传播到整个图像以实现平滑的着色。
为了了解网络选择哪些颜色样本，我们计算预测结果与第5列中对齐的参考图片之间的色度差（“蓝色”表示几乎没有差异，而“红色”表示显着差异）。具有较小错误的点的颜色更可能由网络选择，然后保留在最终结果中。
“网络如何推断出良好的样本？”或者“良好的样本可以从图像之间的匹配中直接推断出来吗？”为了回答这些问题，我们将差异图（第6列）与平均五级匹配误差 $1 - sim_{T→R}$ （第7列）和 $1 - sim_{R→T}$ （第8列）进行比较。
一方面，我们可以看到匹配错误与差异图基本一致。这表明我们的网络可以根据匹配质量学习良好的采样，这是确定适当位置的关键“提示”。另一方面，我们发现网络并不总是选择具有较小匹配误差的点，这是由大量不一致样本所证明的。没有相似性图片，Colorization子网很难推断出对齐参考图片和输入图片之间的匹配精度。它还会增加颜色预测的模糊性。因此，根据相似性的自适应选择可能通过直观的启发式是不可行的。但是，通过使用大规模数据，我们的网络可以更直接地学习这种机制。
为了理解感知分支的作用，我们通过单独最小化感知损失来训练它（在等式（6）中）。我们在下图中示出了一个例子。对于这种情况，一些区域与参考图片（即，右“主干”对象）没有很好的匹配。通过仅使用Chrominance分支，我们获得了树干对象的不正确颜色的结果（第4列）。但是，Perceptual分支能够解决这个问题（第8列）。它预测了躯干的单一和自然棕色，因为训练数据中的大部分树干都是棕色的。因此，感知分支的预测纯粹基于来自大规模数据的对象的主色，并且独立于参考。正如我们在第8列中所看到的，即使对于不同的参考，它也会预测相同的颜色。

为了享受两个分支的优势，我们采用多任务训练策略同时训练两个分支。α用作它们的相对重量。图8第5至7列的双分支结果明确表明我们的网络学会自适应地融合两个分支的预测：在匹配良好的区域选择和传播参考颜色，但推广到从来自不匹配或不相关区域的大规模数据中学习自然颜色。相对权重α调整对每个分支的偏好。根据ImageNet验证数据进行评估，我们在实验中将α= 0.005设置为默认值。
问题二：端对端学习为什么重要？
我们的Colorization子网学习了颜色化中的三个关键组件：颜色样本选择，颜色传播和主色预测。据我们所知，没有其他工作可以通过神经网络同时学习三个步骤。
另一种方法是简单地顺序处理这三个步骤。在我们的研究中，我们采用了最先进的颜色传播和预测方法[Zhang et al。 2017年]。这种基于学习的方法显着推进了以前的优化方法特别是当用户点数很少时。我们尝试两种颜色选择策略：1）阈值：选择具有前10％平均双向相似度得分的色点; 2）交叉校验匹配：选择双向映射满足 $\phi_{T→R}(\phi_{R→T})(p)= p$ 的色点。一旦获得了这些点，我们就直接将它们送到预先训练好的颜色传播网络。我们分别在下图的第3和第4列中显示了两个预测的着色结果。

正如我们所看到的，着色效果不佳并且引入了许多明显的颜色伪影。一个可能的原因是网络[Zhang et al。 2017]未经过输入样本类型的培训，而是使用用户指导的点进行培训。因此，这种顺序学习总是会导致次优解。
此外，该研究还表明难以确定手工制作的点选择规则，如第5.1节所述。通过启发式方法很难消除所有不正确的颜色样本。
预训练的网络也将传播错误的样本，从而导致这种伪像。相反，我们的端到端学习方法通过联合学习选择，预测和预测来避免这些缺陷，从而形成直接优化最终着色质量的单一网络。

问题三：稳健性
与传统的基于样本的着色相比，我们网络的一个显着优势是参考选择的稳健性。无论参考是否与目标相关或不相关，它都可以提供合理的颜色。下图显示了我们的方法在对目标图像具有不同级别的相似性的变化参考上的效果。正如我们所看到的，当引用图片在其语义内容中更类似于目标时，着色结果自然更忠实于引用图片。在其他情况下，结果将退化为保守的着色。这是由感知分支引起的，该分支预测来自大规模数据集上获得的主要颜色。这种行为类似于现有的基于学习的方法。

此外，我们的网络对不同类型的密集匹配算法也很稳健，如下图所示。请注意，本文的网络仅使用Deep Image Analogy进行训练[Liao et al。 2017]作为默认匹配方法，并使用各种匹配算法测试网络。我们还可以观察到结果更加忠实于良好对齐区域的参考颜色;而结果在未对准区域退化为主色(dominant colors)。

注意，更好的对齐结果可以改善可以在引用图片中找到语义对应关系的对象的结果，但是不能帮助给引用对象中不存在的对象的着色。
问题四：可转移性
以前基于学习的方法是数据驱动的，因此只能将与共同属性共享的图像与训练集中的图像着色。由于他们的网络是在自然图像上训练的，例如ImageNet数据集，因此它们将无法为看不见的图像提供令人满意的颜色，例如人类创建的图像（例如，绘画或漫画）。它们的结果可能降低到没有着色（下图中的第1，第3列）或引入显着的颜色伪影（第2列）。相比之下，我们的方法受益于参考图片，并成功地在两种情况下都有效。虽然我们的网络在训练中没有看到这种类型的图像，但是通过Chrominance分支，它学习了基于图像对的相关性来预测颜色。学到的能力对于看不见的物体是常见的。

六、对比结果
结果好就完事了。（太晚了懒得挨个翻译……翻译完下一章睡觉吧）
放图放图。
这个VGG Top-X 准确度忘了是干啥用的了……
与基于样例图片的方法进行比较

图片的真实程度更高，更难以被用肉眼分辨
与基于学习的方法作比较
图片着色是否自然真实，是否能骗得了人的肉眼呢？上面给出了答案。

用户通过学习生成的一些结果（全自动学习？？）

与基于交互的方式比较

与全局颜色直方图方式进行比较
为经典的图片上色
对视频也可进行着色。
七、网络的局限性以及总结
总结：
本文设计了一种基于样例图片的深度学习的方法。即使样例图片并不能提供有效的信息，本文这种方法依然可以生成合理而又自然的着色结果。不同于以往深度学习框架，我们仍可以手动控制着色的结果。与此同时，我们也可以通过自动着色来对图片和视频上色。
局限性：
1、受到感知力损失函数的影响，我们无法去生成含有特别奇怪或者艺术家所形成的颜色

2、其次，基于分类网络（VGG）的感知损失不能惩罚语义重要性较小的区域中的错误的颜色，例如图21第二行中的墙壁，或者不能区分具有相似局部纹理的较少语义区域，例如如图21第三行中类似的沙子和草纹理。此外，当图像之间存在明显的亮度差异时，我们的结果不太忠实于参考图片，如图21的底行所示。为了缓解最后这种情况，我们的参考图片推荐算法在本地排名中强制执行亮度相似性。我们的方法偶尔无法预测某些局部区域的颜色，如下图。因此，探索如何更好地平衡网络的两个分支是很重要的。

你可能感兴趣的:(LDR2HDR)

Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL