NAS论文阅读笔记(DNAS)

DARTS: Differentiable Architecture Search

论文链接:https://arxiv.org/abs/1806.09055 论文链接
代码链接:https://github.com/quark0/darts 代码链接

Abstract:

This paper addresses the scalability challenge of architecture search
by formulating the task in a differentiable manner.

our method is based on the continuous relaxation of the architecture
representation, allowing efficient search of the architecture using
gradient descent

faster than state-of-the-art non-differentiable techniques.

DARTS将搜索空间放宽为连续的,这样就可以通过梯度下降的方法来优化架构使其在验证集上表现得更好。特点是使用数量级较小的计算资源,比ENAS表现更出色,DARTS比很多现有的方法更简单,因为它不包括controllers,hypernetworks or performance predictors,并且它是在卷积和循环架构中通用的。DARTS能够在丰富的搜索空间中学习具有复杂图形拓扑的高性能架构构建块,不局限于任何特定的体系结构。

主要贡献:
1.提出了一种基于二层优化的可微网络结构搜索算法
2.表明基于梯度的架构搜索在CIFAR-10和PTB上超过了目前水平
3.实现了显著的效率提升(将架构发现的成本降低到几个GPU days),这归功于基于梯度的优化
4.证明了在CIFAR10和PTB上通过DARTS学习到的架构可以分别转移到Imagenet 和 WikiText-2

Search Space

搜索computation cell 作为最终架构的 building block ,学习到的cell既可以以stack的方式组成一个卷积网络,也可以以recursively connect的方式组成一个循环网络。
一个cell是一个由N个nodes组成的有向无环图,每个node xi 是一个潜在的表示,每一个边由一些操作o组成,假设cell有两个input nodes,output of the cell是通过对所有中间节点应用reduction operation(eg:concatenation)获得的。
所有的中间节点的计算基于它的前节点。
NAS论文阅读笔记(DNAS)_第1张图片
NAS论文阅读笔记(DNAS)_第2张图片
zero operation 代表两个节点之间没有连接。所以学习cell转化成了学习边上的操作。

Continuous Relaxation And Optimization

o是一系列的可选操作,每一个操作代表应用在x上的函数o(),为了让搜索空间连续,将绝对的一个特定操作的选择放宽到了一个所有可能操作的softmax
NAS论文阅读笔记(DNAS)_第3张图片
操作融合了一对nodes的权重并用一个维度为|o|的向量α参数化。架构搜索转化我了学习一组连续变量α,在搜索的最后,通过将每个混合操作替换成最可能的操作就可以得到一个离散的架构。
NAS论文阅读笔记(DNAS)_第4张图片
relaxation之后,目标是共同学习架构α和所有混合操作的权重,DARTS目标是用梯度下降优化validation loss 。
Ltrain和Lval由α和w决定,架构搜索的目标是找到α*,最大限度地减少验证损失在这里插入图片描述
与架构相关的权重W*通过最小化训练损失在这里插入图片描述
得到。
NAS论文阅读笔记(DNAS)_第5张图片
NAS论文阅读笔记(DNAS)_第6张图片

Aproximate Architecture Gradient

用如下方法简化计算,
NAS论文阅读笔记(DNAS)_第7张图片
其中ξ是学习率。
对上式执行连式法则得到
在这里插入图片描述
在运用有限差分估计得到
在这里插入图片描述
将ξ=0作为一阶近似,将梯度公式ξ>0作为二阶近似

Deriving Discrete Architecture

为了组织离散体系结构中的每个节点,保留从前面所有节点收集的所有非零候选操作中(来自不同节点)的前k个最强操作,一个操作的强度定义为
NAS论文阅读笔记(DNAS)_第8张图片
NAS论文阅读笔记(DNAS)_第9张图片
NAS论文阅读笔记(DNAS)_第10张图片
NAS论文阅读笔记(DNAS)_第11张图片
NAS论文阅读笔记(DNAS)_第12张图片
NAS论文阅读笔记(DNAS)_第13张图片
NAS论文阅读笔记(DNAS)_第14张图片
NAS论文阅读笔记(DNAS)_第15张图片

你可能感兴趣的:(NAS,深度学习,人工智能)