大数据文摘专栏作品
作者:Christopher Dossman
编译:fuma、李琳、云舟
呜啦啦啦啦啦啦啦大家好,拖更的AI Scholar Weekly栏目又和大家见面啦!
AI Scholar Weekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。
每周更新,做AI科研,每周从这一篇开始就够啦!
本周关键词:神经网络、中美AI争霸、华为发布AI芯片
使用双回火逻辑损失训练具有噪声数据的神经网络
在最近的一篇论文中,Google Research发布了一种称之为“基于Bregman发散的鲁棒双回火逻辑损失”的方法。这种方法可以处理逻辑函数所遇到的噪声数据挑战。他们的方法是基于Bregman发散,并且优于使用Tsallis发散的双回火方法。
他们将温度引入了指数函数,并通过高温一般化替换神经网络的softmax输出层。出于同样的原因,训练的对数损失中的对数由低温对数交换。然后,他们通过调整两个温度来创建已经处于单层情况的非凸损失函数。在使用逻辑损失的双温度推广替换网络的最后一层的后,训练对噪声变得更加鲁棒。
文中所提出的双回火损失函数在模型训练上实现了出色的经验性能。它显示了处理大边际异常值的巨大潜力,并且还引入了重尾处理小边距错误标记数据的方法。
研究人员将双回火损失函数与逻辑进行了比较,并验证了它在各种图像分类任务中的实际应用。他们使用MNIST数据集进行了中等规模的实验,并在CIFAR-100实验了100个不同类别的真实世界图像,以及在ImageNet-2012上实验了大规模图像分类。
代码:
https://github.com/google/bi-tempered-loss
原文:
https://ai.googleblog.com/2019/08/bi-tempered-logistic-loss-for-training.html
Google AI:重量不可知神经网络(WANN)
Google AI已经提出了一种神经网络架构的方法,可以在没有任何明确权重训练的情况下执行任务。他们质疑了神经网络架构在无需学习任何权重参数的情况下单独为任何给定任务编码解决方案的程度。研究人员使用统一随机分布实验的单个共享权重参数填充连接,并测量预期性能。
他们能够通过找到最能充分发挥其性能的单一共享权重参数来轻松训练WANN。
通过探索神经网络架构,Google提供了表现良好并且无需学习权重参数即可实现更高精度的代理。
他们的结果表明,这一方法可以找到最小的神经网络架构,在无需权重训练的情况下即可执行几个强化学习任务。此外,通过使用WANN架构的副本,研究人员可以为同一任务创建许多不同模型的集合,这通常可以实现比单个模型更好的性能。快速微调权重的能力可能对持续的终身训练很有用,在这种训练中,代理可以在整个生命周期内获得,适应和转移技能。
这项工作可以帮助我们发现新的神经网络组件,如卷积网络等,其发现和应用有助于深度学习进一步发展。
代码:
https://github.com/google/brain-tokyo-workshop/tree/master/WANNRelease
原文:
https://ai.googleblog.com/2019/08/exploring-weight-agnostic-neural.html
多任务多标签学习方法,人员再识别的新基准
研究人员最近为ICS人员再识别制定了多任务多标签(MTML)的学习方法。MTML方法采用多任务学习框架,以多标记方式共同考虑独立的特定于摄像机的身份辨别标记信息和自发现的摄像机间身份关联。研究人员使用了三个重要的数据集,包括Market-1501,DukeMTMCreID和MSMT17。
在评估时,结果表明MTML优于现有的人员再识别模型。
这一方法充分利用了可用的弱再识别监督约束,同时通过循环分类一致性思想自我挖掘相机间的身份关联。
该技术旨在消除监控网络中对摄像机视图中手动注释繁琐身份类别过程,这一过程此前因为既昂贵又稀疏而饱受批评。
它提供了一种更具可扩展性的摄像机内监督(ICS)人员再识别方法,其特征在于无需交叉视图成对标记的人员再识模型学习,但仅具有每个摄像机独立的人物身份标签。由于在这一数据标记中没有相机间关联,因此MTML被专门设计用于在联合多任务推理框架下通过相机间多标签学习组件自发现相机间的身份对应。
此外,MTML还可以使用基于多摄像机多任务学习所提供的摄像机身份标签有效地学习辨别性再识别特征。
原文:
https://arxiv.org/abs/1908.10344v1
将稀疏递归神经网络用于图像字幕
马来西亚吉隆坡大学和马来西亚大学的研究人员最近提出了一种端到端的修剪方法,可以应用于图像字幕模型,该模型具有视觉注意力。这一方法为极端稀疏提供了非常好的性能稀疏比。与最先进的模型相比,它能够实现97%以上的稀疏度水平,而相对于基线而言,并未造成显著的性能损失。
为了验证该方法的有效性,使用流行的MS-COCO评估工具包对其进行了评估,该工具包计算了BLEU,METEOR,ROUGE-L,CIDEr,和SPICE。
在保持字幕性能并同时最大限度地提高压缩率方面,该方法的性能明显优于原有方法。该方法在从80%到97.5%的稀疏度水平上取得了良好的性能。这与传统方法形成了鲜明的对比,在稀疏度为90%的情况下,传统方法的性能就会显著下降。
这一方法使用简单,而且易于调整稀疏度级别,为从业者轻松控制所需的稀疏度和压缩级别提供了一种方法。因此,为特定场景开发量身定制的解决方案具有巨大的潜力。这些结果也为移动和嵌入式设备的部署铺平了道路,因为它们体积小,内存需求也相对较低了。
研究人员希望将该方法推广到图像分类、语言建模、自然语言翻译等CV和NLP任务中。
原文:
https://arxiv.org/abs/1908.10797
AI的普适性:伦理问题的相关讨论
如今,AI领域的发展为未来提供了许多可能性。因而,此时此刻更应考虑AI带来的日渐迫切的伦理方面的挑战,特别是AI科技对所有族群的普世性。
这篇论文具体讨论了当发展新的AI技术时应该考虑到的包容性、偏好性、隐私性、故障率、目标设定、模仿数据、以及社会接受性方面的因素。在包容性方面,就比如最新型的语音识别系统在虚拟语音助理的大行其道下变得流行。然而,这套系统对于有口吃、语言困难、听觉障碍等表达障碍的人群并不适用。
在接下来的篇幅中,研究者探讨了上文提到的每一个因素如何影响到科技进步的普世性,特别是对身体有障碍的群体而言。
本文没有谈到的是,正因为整个AI社区急于推进更多令人惊叹的、有帮助的AI技术的发展,才更应该认真考虑AI伦理方面的问题以及AI技术对所有人群的适用性。
这篇文章很大程度地提醒了我们有必要让所有人知道日渐明显的AI伦理方面的问题。这篇文章还表明了对AI研究者、开发者,以及整个AI社群来说,认真考虑文中提到的因素,并保证身体有障碍的人群不会被AI技术忽视至关重要。
原文:
https://arxiv.org/abs/1908.08939
为手机设备配置面部识别系统的简单、有效的模型:
https://arxiv.org/abs/1908.09124v2
转换说话人嵌入到目标域以提升性能:
https://arxiv.org/abs/1908.10092
近期AI方面发展成果汇总,以机器学习、深度学习为重点:
https://arxiv.org/abs/1908.10345v1
一个人工的数据集。集合了不同的音乐形式、类型、以及其心理方面、社会影响方面的特点。以不同音乐类型为注释,时间、年份为索引:
https://arxiv.org/abs/1908.10275
机器学习对电子游戏发展的贡献:
https://arxiv.org/abs/1908.10127
科技巨头对AI的未来产生意见分歧 :
https://news.yahoo.com/ma-vs-musk-tech-tycoons-spar-future-ai-072845073–finance.html
甲骨文终于开始推广并扩展基于机器学习的应用和工具:
https://www.zdnet.com/article/oracles-machine-learning-strategy/
中国将会在AI领域取代美国的地位吗?
https://www.scientificamerican.com/article/will-china-overtake-the-u-s-in-artificial-intelligence-research/
中国科技巨头华为发布其低能源消耗AI芯片。该芯片将在2020年的第一季度开放源代码:
https://www.zdnet.com/article/huawei-unleashes-ai-chip-touting-more-compute-power-than-competitors/
不可思议!YouTube用这些方式利用AI以及机器学习:
https://www.forbes.com/sites/bernardmarr/2019/08/23/the-amazing-ways-youtube-uses-artificial-intelligence-and-machine-learning/#68b698a05852