这两天想的方向

没有仔细精读论文,有些想法可能未必正确,周末把内容精细化并扩充

  1. point-capsule for point cloud recognition
    目前已经有3D capsule和pointnet/pointnet++了,看看能否把capsule改造成快速高效应对point cloud data的改进模型

整理3D deep learning / capsule / graphical CNN (deep graphical network) / deep fisher net论文集并认真阅读
先从读pointnet入手?先做一个general survey

  1. de-capsule 模仿FCNN中反卷积deconvolution的模式,构建capsule的反向模式,实现capsule-type end-to-end (不知道这个可行否)

  2. 学习self-attention机制的论文,构建 (1) Self-attention 3d capnet,(2) Self-attention point net

  3. 结合transfer learning/semi-supervised learning构建co-attention CNN/capsule

  4. capsule是否能引入latent variable用以增强对几何关系的描述能力?思路就是:latent capsule networks - bridging statistical and information theory for structure relationship representation ?/ relational capsule network / check relation CNN

张钹、朱军团队最新论文:深度隐式模型 + 概率图模型 = Graphical-GAN
https://www.leiphone.com/news/201804/4ed0ZWDrWP1XN6hw.html

  1. CVPR2018中GAN特别火,能否提出Adversarial deep density clustering???

attention clustering ->扩展到science中的density clustering中?for video segmentation?

GAN in MRF ? bridging statistical model and deep NN

CNN in MRF: Video Object Segmentation via Inference in A CNN-Based Higher-Order Spatio-Temporal MRF

本文由 AI Lab 独立完成。本文讨论了视频对象分割的问题,其中输入视频的第一帧初始对象的掩膜是给定的。作者提出了一个新的时空马尔可夫随机场(MRF)模型来解决问题。与传统的 MRF 模型不同,作者提出的模型中像素之间的空间相关性由卷积神经网络(CNN)编码。具体而言,对于给定的对象,可以通过用该对象预先训练的CNN来预测一组空间相邻像素进行分割标记的概率。因此,集合中像素之间的更高阶更丰富的依赖关系可以由 CNN 隐式建模。然后通过光流建立时间依赖关系,所得到的MRF模型结合了用于解决视频对象分割的空间和时间线索。然而,由于其中非常高阶的依赖关系,在MRF模型中执行推理非常困难。为此,作者提出了一种新颖的嵌入 CNN 的近似算法来有效地执行MRF模型中的推理。该算法通过迭代交替执行两个步骤:时间融合步骤和前馈CNN步骤。通过使用一种简单的基于外观的分割CNN进行初始化,作者提出的模型性能超过了DAVIS 2017挑战赛的获奖方法,而无需借助模型集成或任何专用检测器。

  1. interactive/interaction 是一个大类,交互式,参考active learning

interactive deep clustering (先check interactive clustering)

你可能感兴趣的:(这两天想的方向)