之前我们整理过视觉顶会CVPR2017的论文解读文章 和NIPS 2017 论文解读集锦,ICCV2017已经结束一段时间了,为了能够让大家更深刻了解ICCV的论文,我们进行了下面的整理。
PS.之前也分享过ICCV 2017的论文分类汇总,有兴趣的朋友们可在该链接中查看:ICCV2017|计算机视觉顶级会议ICCV2017论文分类汇总(更新中)
本文从算法细节方面,对高清实景合成的原理进行了解读。
微软亚洲研究院的一篇论文《Interleaved Group Convolutions for Deep Neural Networks》入选 了ICCV 2017。论文中提出了一种全新的通用卷积神经网络交错组卷积(Interleaved Group Convolution,简称 IGC)模块。本文中,微软亚洲研究院视觉计算组王井东研究员详细解读了这篇论文的研究工作。
知乎上关于ICCV 2017较受人关注的文章的讨论。
行人重识别是计算机视觉领域一个偏应用的话题,主要涉及智能安防/智能监控。在本篇文章中,近期发表了ICCV2017论文,来自悉尼科技大学的博士生郑哲东分享了行人重识别的相关内容。
本文对一篇入选ICCV的论文《What Actions are Needed for Understanding Human Actions in Videos?》进行了要点的一些总结。
这是一篇论文笔记,主要对入选ICCV的一篇论文《Predicting Visual Exemplars of Unseen Classes for Zero-Shot Learning》进行了要点的一些总结。
本文是对入选ICCV的一篇论文《Learning Background-Aware Correlation Filters for Visual Tracking》的一些要点总结。
本文是对阿里iDST与西安电子科大、西安交大等合作的 ICCV 2017 论文《基于层次化多模态LSTM的视觉语义联合嵌入》的解读。
在一篇已经被ICCV 2017接收的论文中,诺丁汉大学的研究人员提出了他们号称是迄今最大3D人脸对齐数据集,以及精准实现2D、3D以及2D到3D人脸对齐的网络。本文简要地概述了他们的这项研究成果。
在目标追踪界泰斗杨明玄教授的指导下,香港城市大学等研究人员从深度学习的角度出发,提出了一种端到端的跟踪模型,将特征提取和响应生成融合在深度学习框架中,只采用单层卷积的端到端结构,就达到了利用深度特征的传统协同滤波器的效果。本文将对此进行简要的解读。
计算机视觉领域顶会之一的 ICCV 结束不久,图像质量提升、从头创建图像、风格迁移、图像描述等方面都出现许多新颖、创造性的工作。本文对ICCV上13个最令人印象深刻的项目进行了梳理。
本篇文章中,FAIR的研究员Soumith Chintala总结了训练GAN的16个技巧,例如输入的规范化,修改损失函数,生成器用Adam优化,使用Sofy和Noisy标签,等等。这是NIPS 2016的Soumith Chintala作的邀请演讲的修改版本。
Google Brain 研究科学家Ian Goodfellow在ICCV 2017上作为主题为《生成对抗网络(Generative Adversarial Networks)》的Tutorial 最新演讲, 介绍了GAN的原理和最新的应用。本文对Ian Goodfellow的演讲PPT进行了解读。
牛津大学VGG组在ICCV2017发布了一篇论文《Detect to Track and Track to Detect》。本文将为大家解读这篇论文。
来自牛津大学等院校的研究者们提出了一种基于自编码器与 GAN 的机器学习 3D 建模方式 3D-RecGAN,可以在只需要一张图片的情况下准确构建物体的 3D 结构。本文将对这项研究成果进行简要的介绍。
上海交通大学人工智能实验室的研究人员提出了一种新的方法,能够在保证网络模型精度的前提下对深度网络进行压缩。相关论文已被ICCV 2017接收,由上海交通大学人工智能实验室李泽凡博士实现,倪冰冰教授,张文军教授,杨小康教授,高文院士指导。本文将对这项研究成果简单地进行解读。
利用卷积神经网络让图片清晰化的研究目前正成为计算机视觉领域的热点方向。而南京理工大学邰颖、杨健、许春燕与密歇根州立大学刘小明等人提出的MemNet将技术又向前推进了一步,新模型在图像去噪、超分辨率和JPEG解锁任务中的表现均超过此前业内最佳水平。本文将对这项研究进行简要的介绍。
微软亚洲研究院多媒体搜索与挖掘组在ICCV 2017会议上发布了一项研究成果,它专注于如何利用大量视频数据来训练视频专用的深度三维卷积神经网络,提出一种基于伪三维卷积(Pseudo-3D Convolution)的深度神经网络的设计思路,并实现了迄今为止最深的199层三维卷积神经网络。本文将对此项成果进行简要的解读。
作者调查了室外真实场景下的 Person ReID 工作,大部分相关工作都是 detection+ReID 分成两步来做的,这篇文章提出 NPSM 方法来实现一步到位。
在ICCV 2017会议中,华人表现非常强劲。有40%的投稿来自中国,何恺明还包揽了两项最佳论文奖。
由于水平有限,可能会有错误或者遗漏,欢迎大家指出~