v_JULY_v

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗

作者：Ian Goodfellow
翻译：七月在线DL翻译组
译者：范诗剑汪识瀚李亚楠
审校：管博士寒小阳加号
责编：翟惠良 July
声明：本译文仅供学习交流，有任何翻译不当之处，敬请留言指正。转载请注明出处。
下载：https://ask.julyedu.com/question/7664

前言

今年春节前，萌生一个想法，深度学习越发火热，但一些开创性的论文多半来自国外，如果组织一些朋友把这些英文论文翻译成中文，是不是可以让信息流通的更快、更顺畅？

说干就干。春节前两周组建好七月在线DL翻译组，然后翻译组的小伙伴们即开始翻译，有一组更是在春节期间翻译了GAN之父在NIPS 2016上做的长达60页的报告，当时着实震惊了一把。而且，这篇报告中的GAN也不过是2016年刚火起来，如此，本报告兼具经典和最新，值得好好学习一下。

下面，我们就来看看GAN之父到底在这篇长达60页的论文当中说了些啥。

事情回到2016年的NIPS上，Ian Goodfellow做了主题为《生成对抗网络（Generative Adversarial Networks）》的报告，当时他的报告包括以下主题：

为什么生成式模型是一个值得研究的课题
生成式模型的工作原理，以及与其他生成模型的对比
生成式对抗网络的原理细节
GAN相关的研究前沿
目前结合GAN与其他方法的主流图像模型

关于原英文精辟演示文稿请点击——
PDF版：www.iangoodfellow.com/slides/2016-12-04-NIPS.pdf
KeyNote版：www.iangoodfellow.com/slides/2016-12-04-NIPS.key

一句话描述GAN——

GAN之所以是对抗的，是因为GAN的内部是竞争关系，一方叫generator，它的主要工作是生成图片，并且尽量使得其看上去是来自于训练样本的。另一方是discriminator，其目标是判断输入图片是否属于 真实训练样本。
更直白的讲，将generator想象成假币制造商，而discriminator是警察。generator目的是尽可能把假币造的跟真的一样，从而能够骗过discriminator，即生成样本并使它看上去好像来自于真实训练样本一样。

如下图中的左右两个场景：

为什么要研究GAN

你或许会这么以为：对于计算机视觉领域该模型虽然能提供更多的图像，但这恰恰是真实世界并不缺少的

GAN的基本原理

生成对抗网络是一种生成模型（Generative Model），其背后最基本的思想就是从训练库里获取很多的训练样本（Training Examples），从而学习这些训练案例生成的概率分布。
- 生成模型为高维分布的表示与处理提供了一个绝佳的测试机会——此类高维分布往往是工程应用中的重要研究对象；

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第2张图片

- 生成式模型能以多种方式嵌入至强化学习中；

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第3张图片

- 生成模型可以接受缺失训练数据，或者可以被用来预测缺失数据。生成对抗模型，使得机器学习可以处理复合式问题。

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第4张图片

基于GAN的应用

——iGAN（交互式生成对抗网络）

用户可以绘制一幅草稿，然后iGAN会使用GAN模型来生成最相似的合理图像。

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第5张图片

——IAN（自省对抗网络）

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第6张图片

——图对图变换

将单幅卫星图像变为地图；将涂鸦转化为相片级别图像等；由于许多这样的转换都存在超过一种的正确输出，为保证模型训练的正确性，使用生成模型就有了必要性。

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第7张图片

GAN之最大似然估计的模型

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第8张图片

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第9张图片

GAN的损失函数

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第10张图片

DCGAN——深度的卷积GAN

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第11张图片

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第12张图片

GAN的tips和tricks——（下文简称t&t）

很难具体的说哪些技巧更有效，实际情况是，它们可以在某些任务中提升效果，也可能在另一些任务中起相反作用。因此这些技巧可以拿来尝试，但不要把它们当成是某种最优方法。具体包括：使用标签参与训练；单边标签平滑；将batch normalization虚拟化；是否平衡G和D（小编理解：作者目前的观点是，GANs主要是估计两个概率密度分布的比值，而只有当鉴别器足够完美时才有可能正确估值。所以这里更应该强化D函数）。
关于怎样训练GAN模型，详见GitHub库：http://github.com/soumith/ganhacks

t&t1.使用标签参与训练

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第13张图片

t&t2.单边标签平滑

GAN的工作方式是让discriminator估算两个概率密度分布的比值，但是深度神经网络倾向于生成过高置信度的结果，容易走极端，这对模型是不利的。尤其是基于对抗生成的网络，它的分类器倾向线性推断并产生出置信度极高的结果。

t&t3.将batch normalization虚拟化

GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）_第14张图片

后记

关于我们。七月在线DL翻译组是由一群热爱翻译、热爱DL、英语六级以上的研究生或博士组成，有七月在线的学员，也有非学员。本翻译组翻译的所有全部论文仅供学习交流，宗旨是：汇集顶级内容帮助全球更多人。目前已经翻译数十篇顶级DL论文，详见：https://ask.julyedu.com/question/7612
加入我们。如果你过了英语六级、是研究生或博士、且熟练DL、热爱翻译，欢迎加入我们翻译组，微博私信@研究者July
GAN课程。为了帮助更多人更好的了解、学习、入门GAN，今年上半年，我们七月在线亦会开《生成对抗网络班》，从头到尾详解GAN的原理及其实战应用，敬请期待。

七月在线July、二零一七年三月七日。

你可能感兴趣的:(机器学习十大算法系列)

CNN笔记安安csdn 机器学习深度学习 cnn 30.Machine L &Deep Learning 机器学习十大算法系列
原创CNN笔记：通俗理解卷积神经网络2016-07-0222:14:50v_JULY_v阅读数259238更多分类专栏：30.MachineL&DeepLearning机器学习十大算法系列1前言2012年我在北京组织过8期machinelearning读书会，那时“机器学习”非常火，很多人都对其抱有巨大的热情。当我2013年再次来到北京时，有一个词似乎比“机器学习”更火，那就是“深度学习”。本博客
从贝叶斯方法谈到贝叶斯网络 daihao1413 机器学习贝叶斯网络 30.Machine L &Deep Learning 机器学习十大算法系列
原从贝叶斯方法谈到贝叶斯网络2014年11月10日19:04:49v_JULY_v阅读数111811更多分类专栏：30.MachineL&DeepLearning机器学习十大算法系列从贝叶斯方法谈到贝叶斯网络0引言事实上，介绍贝叶斯定理、贝叶斯方法、贝叶斯推断的资料、书籍不少，比如《数理统计学简史》，以及《统计决策论及贝叶斯分析JamesO.Berger著》等等，然介绍贝叶斯网络的中文资料则非常少
机器学习实战笔记8—随机森林业余狙击手19 ML
注：此系列文章里的部分算法和深度学习笔记系列里的内容有重合的地方，深度学习笔记里是看教学视频做的笔记，此处文章是看《机器学习实战》这本书所做的笔记，虽然算法相同，但示例代码有所不同，多敲一遍没有坏处，哈哈。（里面用到的数据集、代码可以到网上搜索，很容易找到。）。Python版本3.6机器学习十大算法系列文章：机器学习实战笔记1—k-近邻算法机器学习实战笔记2—决策树机器学习实战笔记3—朴素贝叶斯机
机器学习实战笔记5—支持向量机业余狙击手19 ML
注：此系列文章里的部分算法和深度学习笔记系列里的内容有重合的地方，深度学习笔记里是看教学视频做的笔记，此处文章是看《机器学习实战》这本书所做的笔记，虽然算法相同，但示例代码有所不同，多敲一遍没有坏处，哈哈。（里面用到的数据集、代码可以到网上搜索，很容易找到。）。Python版本3.6机器学习十大算法系列文章：机器学习实战笔记1—k-近邻算法机器学习实战笔记2—决策树机器学习实战笔记3—朴素贝叶斯机
【机器学习】知识点汇总 heimu24 机器学习
资源：1、《统计学习方法》代码实现2、吴恩达机器学习课程笔记3、七月在线人工智能面试题4、Datawhale秋招机器学习算法工程师面经5、AI算法工程师手册—华校专6、机器学习十大算法系列—July专栏建议学习顺序：一、基础知识：建议阅读：《统计学习方法》第一章：统计学习方法概论KeyWords：经验风险、结构风险、L1与L2正则化、交叉验证、精确率、召回率ps：1、L1先验服从拉普拉斯分布，L2
机器学习十大算法系列（一）——逻辑回归炼丹术士机器学习
本系列博文整理了常见的机器学习算法，大部分数据问题都可以通过它们解决：1.线性回归(LinearRegression)2.逻辑回归(LogisticRegression)3.决策树(DecisionTree)4.支持向量机（SVM）5.朴素贝叶斯(NaiveBayes)6.K邻近算法（KNN）7.K-均值算法（K-means）8.随机森林(RandomForest)9.降低维度算法（Dimensi
程序员面试、算法研究、编程艺术、红黑树、机器学习5大系列集锦青木宫面试及编程练习经典算法研究程序员编程艺术微软面试100题系列机器学习十大算法系列
转载程序员面试、算法研究、编程艺术、红黑树、机器学习5大系列集锦作者：v_JULY_v分类专栏：经典算法研究程序员编程艺术微软面试100题系列机器学习十大算法系列程序员面试、算法研究、编程艺术、红黑树、机器学习5大经典原创系列集锦与总结（七月在线：https://www.julyedu.com/，面试&算法&机器学习在线课程）作者：July--结构之法算法之道blog之博主。时间：2010年10月
机器学习实战笔记7—K-Means 业余狙击手19 ML
注：此系列文章里的部分算法和深度学习笔记系列里的内容有重合的地方，深度学习笔记里是看教学视频做的笔记，此处文章是看《机器学习实战》这本书所做的笔记，虽然算法相同，但示例代码有所不同，多敲一遍没有坏处，哈哈。（里面用到的数据集、代码可以到网上搜索，很容易找到。）。Python版本3.6机器学习十大算法系列文章：机器学习实战笔记1—k-近邻算法机器学习实战笔记2—决策树机器学习实战笔记3—朴素贝叶斯机
机器学习十大算法系列（一）——逻辑回归 u010402786 机器学习逻辑回归
本系列博文整理了常见的机器学习算法，大部分数据问题都可以通过它们解决：1.线性回归(LinearRegression)2.逻辑回归(LogisticRegression)3.决策树(DecisionTree)4.支持向量机（SVM）5.朴素贝叶斯(NaiveBayes)6.K邻近算法（KNN）7.K-均值算法（K-means）8.随机森林(RandomForest)9.降低维度算法（Dimensi
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他