CVPR 2019 微软亚研 分享会

CVPR2019 微软亚研分享会

    • “Perceive where to focus:learning visibilityaware part features for partial person reidentification” 行人再识别
    • “Deeper and wider siamese networks for real-time visual tracking” 多帧跟踪
    • “Visual Tracking via daptive Spatially Regularized Correlation Filters” 单目标跟踪
    • “Self-Supervised Convolutional Subspace Clustering Network” 低维子空间聚类
    • “Progressive Teacher-student Learning for Early Action Prediction” 行为预测
    • “Single-Image Piece-wise Planar 3D Reconstruction via Associative Embedding” 3D重建任务
    • “SeerNet: Predicting Convolution Neural Network Feature-Map Sparsity through Low-Bit Quantization” 稀疏性计算提升计算效率
    • “Multi-label image recognition with graph convolutional networks” GCN 图网络

分享会视频:转自AI研习社

“Perceive where to focus:learning visibilityaware part features for partial person reidentification” 行人再识别

清华大学 行人再识别

  1. 【问题】:行人部分可见(部分被遮挡会引入噪声);
  2. 【方法&创新】:region部件特征提取,可见部分给高评分,否则给低评分;
  3. 【创新】:VPM(Visibility-aware Part Model)分块为可见部分和不可见部分,构建自监督的过程;
  4. 【方法】三个Loss:人体Loss、ID、不同ID鉴别;
    将人体分多个区域,感知出现区域,共享区域和已知区域对比;

“Deeper and wider siamese networks for real-time visual tracking” 多帧跟踪

微软亚研 Visual Object Tracking:多帧跟踪

  1. 【孪生卷积网络】:
    Siamese Trackers:孪生卷积网络【共享输入和参数】
    Feature Space更具有鲁棒性;
    SiamFC:给模版和区域,在区域搜索模板,得到Score Map;
    SiamRPN:跟从SiamFC,上是分类,下是回归;

  2. 【工作出发点和动机】:
    SiamFC和SiamRPN替换AlexNet为更深的网络;
    提升网络难以提升好效果;
    Padding:加上会降低->加上后为0边缘的padding,造成网络看到的0边缘和原图不一样;

  3. 【网络流程】:
    替换SiamFC和SiamRPN;
    训练:从后向前逐步释放Layer


“Visual Tracking via daptive Spatially Regularized Correlation Filters” 单目标跟踪

大连理工 单目标跟踪

  1. 【问题】相关滤波自适应跟踪算法和CNN网络研究,500帧达到瓶颈;
  2. 【方法】CF框架和CNN结合框架;
  3. 【方法】相关滤波:
    提取多目标检测窗口 - FFT - CNN - DFFT
    高亮部分会导致学习滤波器有影响;
    增加自适应空间正则;

“Self-Supervised Convolutional Subspace Clustering Network” 低维子空间聚类

北邮 李春光 高维数据在低维子结构中【低维子空间聚类】

  1. 构建相似度矩阵;

  2. 构建相似点聚类;

  3. 如何构建好的相似度矩阵:高维空间之中空间信息不好用;

  4. 自表示模型 用点和其他点的相似度系数表示该点的位置;

    原始表示不能符合低维子空间分解
    传统:核方法、矩阵分解
    MLP+SSC -> DSCNET 谱聚类
    “卷积 特征抽取 普聚类”合成一起;


“Progressive Teacher-student Learning for Early Action Prediction” 行为预测

中山大学 行为预测 Teacher Student 网络结构

  1. 分为两个问题:
    行为识别:动作完成检验;
    行为预测:动作未做 预先知道;

  2. 提取RGB三通道特征:
    Teacher:双向LSTM;
    Student:单向LSTM;

  3. 数据库:NTU RGB+D、SYSU 3D HOI、UFG-101;


“Single-Image Piece-wise Planar 3D Reconstruction via Associative Embedding” 3D重建任务

上海科技大学 3D重建任务

  1. 给定二维图片 推断3维结构
    对称重复结构 匹配存在问题

  2. 3D重建基于现实世界每个物体 平行/垂直/等 关系
    区分不同平面,对估计的每个区域划分

  3. PPGNet:Learning Point-Pair Graph for Line Segment Detection
    本文对人造环境效果好,不一定适用于自然环境;


“SeerNet: Predicting Convolution Neural Network Feature-Map Sparsity through Low-Bit Quantization” 稀疏性计算提升计算效率

微软亚研 稀疏性计算提升计算效率
训练时将connection为0的矩阵扔掉;

Accuracy和Speed up 不能两全;
Relu负值变为0,MaxPooling取最大值;

卷积 前用低比特计算出mask,仅用Cuda计算mask中的正值;


“Multi-label image recognition with graph convolutional networks” GCN 图网络

旷视 GCN图网络

  1. 单图像中存在多个label物体,训练多个二分类器;
  2. 识别语义关系,并找出相关性-例如在天空中将鱼的label降低;
  3. 腾讯数据集:ML-Image;

你可能感兴趣的:(Computer,Vision,会议分享,CVPR,2019)