(CV Daily Paper 第1期)Thu, 25 Apr 2019

Extensive Reading

(3D目标检测)Deep Hough Voting for 3D Object Detection in Point Clouds

Charles R. Qi, Or Litany, Kaiming He, Leonidas J. Guibas

当前的3D目标检测方法受2D目标检测的严重影响。为了利用2D检测其中的框架,他们经常将3D点云转换为常规网格,或者是依赖2D图像中的检测技术去生成3D boxes。很少有人直接从点云中直接检测目标。在这篇文章中,我们回到初衷,为点云数据构建一个3D检测pipeline,并尽可能的通用。然而,我们面临一个挑战,由于数据的稀疏性,来自3D空间的2D流型样本,当从场景点直接从边框界回归参数时,3D目标中心点可能远离任何表面点,结果很难一步回归精确。为了解决这个挑战,我们提出了VoteNet,一种基于 deep point set 网络和Hough投票协同作用的端到端3D物体检测网络。 我们的模型在两个大型真实3D扫描数据集上实现了最先进的3D检测,ScanNet和SUN RGB-D具有简单的设计,紧凑的模型尺寸和高效率。值得注意的是,VoteNet采用纯靠几何信息不依赖色彩图像的方式,优于以前的方法。


(NAS+人脸识别)Neural Architecture Search for Deep Face Recognition

Ning Zhu, Xiaolong Bai

收到电子设备的普遍波及,与传统摩玛和模式解锁相比,生物识别技术为用户认证带来了极大的便利。在许多生物学特征中,面部是一个通用的且不可替代的功能,不需要太多的合作,同事可以显著改善用户的体验。人脸识别是电子设备宣传的主要功能之一。因此,人脸识别在计算机视觉中非常值得研究。先前的工作主要关注两个研究方向:转换损失函数来提高传统深度卷积神经网络的识别精度(ResNet);将最新的损失函数和最轻量的网络解构组合,以最低的精度损失减小网络的大小。但是这两种方法都没有改变网络的结构。随着AutoML的发展,神经网络搜索(NAS)在图像分类的benchmark熵已经表现了出色的性能。在这篇文章中,我们将NAS技术集成到人脸识别当中,以定制更合适的网络。我们引用了NAS的框架,它交替地训练child and controller network.同时,我们通过将评估延迟纳入强化学习的奖励来变异NAS,并利用策略梯度算法以最经典的交叉熵损失自动搜索体系结构。我们搜索到的网络架构在大规模人脸数据集中具有最先进的精度,以相当小的网络大小在MS-Celeb1M达到98.77%,在LFW中达到99.89%。据我们所知,此提案是首次尝试使用NAS解决深度识别问题并在此领域取得最佳效果。


A Simple Pooling-Based Design for Real-Time Salient Object Detection

Jiang-Jiang Liu, Qibin Hou, Ming-Ming Cheng, Jiashi Feng, Jianmin Jiang

我们通过研究如何扩展卷积神经网络中的pooling作用来解决显著对象检测问题。基于U型架构,我们首先在自上而下的路径上构建一个global guidance module(GGM),只在为不同的特征层提供潜在显著对象的位置信息。我们进一步设计了一个feature aggregation module(FAM),使粗级语义信息与自上而下的路径中的精细级级别特征完美融合。通过在自上而下的路径中添加FAMs,来自GGM的粗级特征可以各种尺寸的特征无缝的合并。这两个pooling-based的模块使得高维语义特征逐步完善,产生洗劫更加丰富的显著图。实验结果表明,我们的方法可以精确地定位有突出细节的显著目标,跟以前的state-of-the-arts相比,基本提升了性能。同时,我们的方法速度快,可以在处理一张300*400的图片跑到30FPS,代码着这个网址.

你可能感兴趣的:(Computer,Version,Daily,Paper)