背景:自从做硬件项目以来,比较偏向于工程实现和代码能力的提升。对于机器学习理论和最新研究进展有很多不足的地方。因此需要多看一些机器学习的论文,了解研究方向与大趋势。
目的:粗略看一些机器学习相关研究的论文。文章多来自于公众号机器之心的梳理。
目录
一、用注意力GAN为百年旧照上色
技术细节
1.1 Self-Attention Generative Adversarial Network
1.2 Progressive Growing of GANs
1.3 Two Time-Scale Update Rule
1.4 Generator Loss
二、CPU实时的,各种朝向的人脸检测
概览
Progressive Calibration Networks (PCN)
三、深度强化学习概览
四、深度神经网络分布式训练概述
五、GAN换装
六、总结
项目地址:https://github.com/jantic/DeOldify/blob/master/README.md
(https://arxiv.org/abs/1805.08318).
Training structure inspired by (but not the same as) Progressive Growing of GANs (https://arxiv.org/abs/1710.10196).
训练过程受到这个文章的启发。
The difference here is the number of layers remains constant – I just changed the size of the input progressively and adjusted learning rates to make sure that the transitions between sizes happened successfully. It seems to have the same basic end result – training is faster, more stable, and generalizes better.
Two Time-Scale Update Rule (https://arxiv.org/abs/1706.08500)GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium
生成器的loss由两部分组成:
论文:Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks
论文地址:https://arxiv.org/pdf/1804.06039.pdf
代码地址:
PCN 多角度实时人脸检测项目地址:https://github.com/Jack-CV/PCN-FaceDetection
摘要:CNN难以处理旋转的图像,即旋转鲁棒性比较差。中科院计算所提出一种渐进的方法校准人脸朝向,并精确控制其位置与角度,并且最近放出了该项目的源码。可以在人脸检测模型上实现CPU的快速实时推断。
贡献点:
具体而言,PCN 会抽选识别候选面部图像块,并将朝下的图像块翻转至正向,这样就会减半 RIP 的角度范围,即从 [−180° , 180° ] 到 [−90° , 90° ]。然后旋转过的面部图像块会进一步区分朝向并校准到垂直向的 [−45° , 45° ] 范围,这样又会减半 RIP 的角度范围。最后,PCN 会分辨到底这些候选图像块是不是人脸,并预测出精确的 RIP 角度。
通过将校准过程分割为几个渐进的步骤,且在早期校准步骤只预测粗略的朝向,PCN 最后能实现精确的校准。此外,每一个校准步骤可以简单地旋转-90°、90°和 180°,因此额外的计算量非常低,这也就是为什么该检测项目能在 CPU 上实时运行的重要原因。通过在逐渐降低的 RIP 范围内执行二元分类(是人脸或不是人脸),PCN 能在 360° RIP 旋转角度内准确地检测到人脸,而本项目重点就是实现这样旋转不变的人脸检测器。
Beyond DQN/A3C: A Survey in Advanced Reinforcement Learning
DeepMind 的工程师 Joyce Xu 近日发表了一篇博客文章,介绍了深度强化学习领域的一些近期进展,其中涉及到分层式强化学习、记忆、注意机制、世界模型和想象等方向。
https://towardsdatascience.com/advanced-reinforcement-learning-6d769f529eb3
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650751210&idx=4&sn=a1d4c4c2b27a7f62a4edbd74f626f23c&chksm=871a8494b06d0d82e3dc22b8a591cde7449d845576bbbdecf98ad513a4326cfe9b34eb6272b4&scene=0&xtrack=1#rd
强化领域最具挑战性的两个问题:
how we interact with the environment effectively (e.g. exploration vs. exploitation, sample efficiency),
如何有效的与环境交互(探索与利用,样本效率)
how we learn from experience effectively (e.g. long-term credit assignment, sparse reward signals).
如何有效利用已有的经验(长期的置信信号评估,稀疏的信号奖励)
In this post, I want to explore a few recent directions in deep RL research that attempt to address these challenges, and do so with particularly elegant parallels to human cognition. 作者想要探讨强化学习领域的这几个研究方向和与人类的认知进行对比:
独立研究者 Karanbir Chahal 和 Manraj Singh Grover 与 IBM 的研究者 Kuntal Dey 近日发布了一篇论文,对深度神经网络的分布式训练方法进行了全面系统的总结,其中涉及到训练算法、优化技巧和节点之间的通信方法等。
文章地址:https://arxiv.org/abs/1810.11787
经网络的分布式训练可以通过两种方式实现:数据并行化和模型并行化:
数据并行化:将数据集均等地分配到系统的各个节点(node),其中每个节点都有该神经网络的一个副本及其本地的权重。每个节点都会处理该数据集的一个不同子集并更新其本地权重集。这些本地权重会在整个集群中共享,从而通过一个累积算法计算出一个新的全局权重集。
模型并行化:通过将该模型的架构切分到不同的节点上来实现训练的分布化。AlexNet [2] 是使用模型并行化的最早期模型之一,其方法是将网络分摊到 2 个 GPU 上以便模型能放入内存中。当模型架构过大以至于无法放入单台机器且该模型的某些部件可以并行化时,才能应用模型并行化。
文章内容:
结论:
为了打造一个高效且可扩展的分布式训练框架,作者推荐使用以下技术:
韩国科学技术院和浦项科技大学的研究人员实现了图片到图片的换装操作,例如照片里的绵羊换成长颈鹿、牛仔长裤换成短裙。
其论文《InstaGAN: Instance-Aware Image-to-Image Translation》已被 ICLR2019 接收。
论文链接:https://arxiv.org/pdf/1812.10889.pdf
项目地址:https://github.com/sangwoomo/instagan
ICLR 链接:https://openreview.net/forum?id=ryxwJhC9YX
贡献点:
强化学习和迁移学习有较多的关注度,GAN在图像处理领域非常火。