点击我爱计算机视觉标星,更快获取CVML新技术
本周新出的计算机视觉代码不是很多,但都是精品。
出自南理工的空域组增强(SGE)网络结构在图像分类和目标检测任务中均表现出一致的有效性,强烈推荐大家关注。
Intel的实时动作识别看起来很吸引人,已经是达到工业应用级别的成果了!
空域组增强(SGE),改进卷积网络中语义特征学习,出自南京理工大学。
SGE可以显著改进图像分类任务的性能,在基于ResNet50为骨干网的实验中,SGE取得了在ImageNet数据集上1.2% Top 1精度的改进,另外结合不同的检测算法中(Faster/Mask/Cascade RCNN and RetinaNet)在COCO数据集上均取得了1%-2%精度的提升。
Spatial Group-wise Enhance: Improving Semantic Feature Learning in Convolutional Networks
Xiang Li, Xiaolin Hu, Jian Yang
https://arxiv.org/abs/1905.09646v1
https://github.com/implus/PytorchInsight
图神经网络临域扩大
在大量的图分类评测数据集上均达到了state-of-the-art。
Neighborhood Enlargement in Graph Neural Networks
Xinhan Di, Pengqian Yu, Mingchao Sun, Rui Bu
https://arxiv.org/abs/1905.08509v1
https://github.com/CODE-SUBMIT/Neighborhood-Enlargement-in-Graph-Network
实时动作识别的轻量级网络架构,来自Intel,相比现有方法取得了很好的速度/精度折中,在CPU上运行达到56fps。
Lightweight Network Architecture for Real-Time Action Recognition
Alexander Kozlov, Vadim Andronov, Yana Gritsenko
https://arxiv.org/abs/1905.08711v1
https://github.com/opencv/openvino_training_extensions/tree/develop/pytorch_toolkit/action_recognition
半监督学习| 增广分布对齐方法
在SVHN 与 CIFAR10 数据集上分别取得了新的state-of-the-art,错误率3.54% 、 10.09%。
Semi-Supervised Learning by Augmented Distribution Alignment
Qin Wang, Wen Li, Luc Van Gool
https://arxiv.org/abs/1905.08171v1
https://github.com/qinenergy/adanet
图像文本联合建模 | 变分异构编码器随机生成对抗网络
在图像文本多模学习和生成的多个任务中均达到state-of-the-art 性能。
Variational Hetero-Encoder Randomized Generative Adversarial Networks for Joint Image-Text Modeling
Hao Zhang, Bo Chen, Long Tian, Zhengjue Wang, Mingyuan Zhou
https://arxiv.org/abs/1905.08622v1
(代码将开源)
基于单幅图像的3D Manhattan 线框重建
只需一幅图像即可完成建筑、家具等物体的3D 结构重建,在设计领域应该很有用。
Learning to Reconstruct 3D Manhattan Wireframes from a Single Image
Yichao Zhou, Haozhi Qi, Yuexiang Zhai, Qi Sun, Zhili Chen, Li-Yi Wei, Yi Ma
https://arxiv.org/abs/1905.07482v1
(代码将开源)
ICRA 2019
基于视觉的机械手臂操作任务的机器人学习平台,包含软硬件一体化的整套评测方案。
REPLAB: A Reproducible Low-Cost Arm Benchmark Platform for Robotic Learning
Brian Yang, Jesse Zhang, Vitchyr Pong, Sergey Levine, Dinesh Jayaraman
https://arxiv.org/abs/1905.07447v1
https://sites.google.com/view/replab/
更多之前代码汇总:
CV Code | 本周新出计算机视觉开源代码汇总(含语义分割、表情识别、目标跟踪、姿态估计、超分辨率等)
CV Code | 本周新出计算机视觉开源代码汇总(含目标跟踪、语义分割、姿态跟踪、少样本学习等)
CV Code | 本周新出计算机视觉开源代码汇总(含自动驾驶目标检测、医学图像分割、风格迁移、语义分割、目标跟踪等)
加群交流
关注计算机视觉与机器学习技术,欢迎加入52CV群,扫码添加CV君拉你入群,
(请务必注明:52CV)
喜欢在QQ交流的童鞋,可以加52CV官方QQ群:702781905。
(不会时时在线,如果没能及时通过验证还请见谅)
长按关注我爱计算机视觉