论文理解第7页

深度学习图像分类（二）——VGG论文理解

0.写作目的好记性不如烂笔头。这里只是笔者记录的过程，如果读者有时间的话，建议看英文论文。1.网络结构1.1为什么采用更小的卷积主要思想是：将卷积核换成卷积核较小的。例如：5*5的卷积的视野与2个3*3的卷积视野相同。7*7的卷积视野与3个3*3的卷积视野相同。以1层7*7的卷积换成3层3*3的卷积为例进行说明：i)使用3层非线性来代替1层非线性，使得决策函数更具有可分性（原文）。可以这样理解：增

holmes_MX·2018-10-09 13:47

读论文太慢太累？唧唧堂阅读单了解一下！

好不容易读完了，却不知道自己对论文理解是否正确？这些大概是研究人读文献最常见的问题了，怎么办？订阅唧唧堂论文阅读单就对啦！每月精选论文，消灭选文焦虑！原创测试卷，助你把握论文重点！

唧唧堂·2018-10-09 00:00

深度学习图像分类（一）——AlexNet论文理解

1.论文理解1.1ReLU激活函数的使用RectifiedLinearUnits(ReLU)使用ReLU比使用tanh（或者sigmoid）激活函数收敛速度更快。

holmes_MX·2018-09-27 15:00

[论文笔记] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

目录关于论文运行论文作者所提供代码论文理解1.关于论文《Richfeaturehierarchie

Code_Mart·2018-08-25 16:55

[论文笔记] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

目录关于论文运行论文作者所提供代码论文理解1.关于论文《Richfeaturehierarchie

Code_Mart·2018-08-25 16:55

轻量级模型：MobileNet V2

一、论文：https://arxiv.org/abs/18非官方Caffe代码：https://github.com/shicai/MobileNet-Caffe二、论文理解MobileNetV2是对MobileNetV1

小麦草·2018-08-05 15:57

FPN-Feature Pyramid Networks论文理解

论文链接：https://arxiv.org/abs/1612.03144FPN创新点低层特征信息与高层语义信息的特征融合有利于小目标的检测写在前面的话FPN的全称是FeaturePyramidNetworks[特征金字塔网络]，图像金子塔是什么？图像金字塔其实在很早便被提出，像比如SIFT,SURF,HOG等传统的特征提取方法均使用了图像金字塔，想了解传统特征提取方法的参考博文http://wa

春枫琰玉·2018-08-03 16:42

FPN-Feature Pyramid Networks论文理解

论文链接：https://arxiv.org/abs/1612.03144FPN创新点低层特征信息与高层语义信息的特征融合有利于小目标的检测写在前面的话FPN的全称是FeaturePyramidNetworks[特征金字塔网络]，图像金子塔是什么？图像金字塔其实在很早便被提出，像比如SIFT,SURF,HOG等传统的特征提取方法均使用了图像金字塔，想了解传统特征提取方法的参考博文http://wa

春枫琰玉·2018-08-03 16:42

XNOR-Net论文理解

本人基本属于网络压缩领域的小白，而且由于任务需要，故研读了文章XNOR-Net:ImageNetClassificationUsingBinaryConvolutionalNeuralNetworks。如有问题，望相互告知，相互学习。本篇文章是在Binary-weight-network(BWN)和BinaryConnect(BC)两篇文章基础上做出改进。主要改进有两点：1.在对权重进行{-1，+

我叫小才·2018-08-01 20:23

MTCNN 论文理解

Multi-taskconvolutionalneuralnetworks人脸对齐MTCNN是2016年ECCV上的一篇文章,做的事情就是人脸检测,以及人脸部分关键点标定.MTCNN的过程和思想都集中在下面这个图.这个图片大概就是说,MTCNN是由3个网络结构组成（P-Net,R-Net,O-Net）的.下面分别介绍一下MTCNN的这个3个网络结构.ProposalNetwork(P-Net)：该

just_sort·2018-07-03 14:31

Learning Compact Binary Descriptors with Unsupervised Deep Neural Networks论文理解

论文1：LearningCompactBinaryDescriptorswithUnsupervisedDeepNeuralNetworks同时参考了@cv_family_z的博文LearningCompactBinaryDescriptorswithUnsupervisedDeepNeuralNetworksCVPR2016开源代码：https://github.com/kevinlin311t

AaronJiang395·2018-06-02 10:04

论文理解《Body Structure Aware Deep Crowd Counting》

论文《BodyStructureAwareDeepCrowdCounting》IEEETRANSACTIONSONIMAGEPROCESSING创新点：从语义场景分析作为出发点，进行人群计数；包含三个关键因素：行人，头部和他们地上下文结构（contextstructure）；行人的语义结构可以提供更丰富的信息用于行人识别；解决问题：现存的方法，大多是直接模拟行人的整个身体或者只有头，没有准确地捕捉

Selieyo·2018-04-24 13:54

Alpha Zero论文理解笔记

结合知乎专栏https://zhuanlan.zhihu.com/p/32089487对alphazero论文进行了学习用MCTS方法进行自博弈得到的棋局训练策略价值网络•策略价值网络○是用来描述alistof(action,probability)tuplesforeachavailableactionandthescoreoftheboardstate○输入：若干个局部棋面描述4*8*8○输出

Eva_young·2018-04-12 02:42

【论文理解】ArcFace: Additive Angular Margin Loss for Deep Face Recognition（InsightFace）

论文地址：https://arxiv.org/abs/1801.07698github：https://github.com/deepinsight/insightface这篇论文基本介绍了近期较为流行的人脸识别模型，loss变化从softmax一路捋到CosFace，然后提出ArcFace，可以说起到很好的综述作用。论文评价对比方面也做了非常详细的对比策略方案分析。数据清洗工作也对后续研究应用有

非文艺小燕儿_Vivien·2018-03-22 18:35

YOLOv2论文理解

YOLO9000:Better,Faster,Stronger论文YOLO9000:Better,Faster,Stronger的主要内容有三点：1、作者提出了YOLOv2。YOLOv2在YOLOv1的基础上，使用新的网络结构（darknet19）和技巧（BatchNormalization、HighResolutionClassifier、ConvolutionalWithAnchorBoxes

zj360202·2018-02-11 16:20

论文理解：AlexNet(一)

alexnet发表于2012年是非常经典的网络。他的主要贡献有：1.使用relu激活函数，加快了模型收敛。2.使用双层结构，进行了gpu并行加速。属于计算图并行。3.提出LRN层，局部归一化。4.overlappingpooling5.基于PCA的图像增强。一、relu激活函数这里不多说了，前面博客里说过，加relu激活函数可以避免梯度消失，因为relu是非饱和函数。首先看一下效果对比：嗯，实线是

尹宇阳·2017-10-18 10:07

论文理解 A Bayesian Hierarchical Model for Learning Natural Scene Categories

《ABayesianHierarchicalModelforLearningNaturalSceneCategories》，中文翻译为《一个用于自然场景分类的贝叶斯层次模型》。该文章由著名的华人人工智能专家李飞飞主笔。接下来，我将从论文讲解、代码实现两个方面阐述这篇论文的思想。这篇博客先进行论文讲解。代码实现可以跳转到以下链接：代码实现Abstract：摘要部分说明了该论文的创新点。“我们通过收集

BIN_GOO·2017-09-18 17:35

YOLOv2论文理解

YOLO9000:Better,Faster,Stronger论文YOLO9000:Better,Faster,Stronger的主要内容有三点：1、作者提出了YOLOv2。YOLOv2在YOLOv1的基础上，使用新的网络结构（darknet19）和技巧（BatchNormalization、HighResolutionClassifier、ConvolutionalWithAnchorBoxes

hrsstudy·2017-04-25 22:22

论文理解：多任务学习及卷积神经网络在人脸识别中的应用

在已有的基于深度学习的人脸识别框架中，每个任务（人脸鉴别、认证和属性分类等）是相互独立设计的。本文提出一种基于多任务框架的深度卷积网络，通过将人脸鉴别、认证和属性分类同时作为网络的目标函数，端到端地训练整个深度卷积网络。此网络可以同时完成上述三种任务，不需要额外的步骤，实验结果显示，即使在有限的数据支持下，该方法依然能够取得不错的性能。在LFW数据集上获得了97.3%的精度。在人脸识别领域，Fac

furuiyang_·2017-04-15 18:34

Learning to Track at 100 FPS with Deep Regression Networks 论文理解及应用笔记（二）

GOTURN算法实践及性能分析云笔记算法实现：个人根据论文及github提示构建算法平台测试环境为：Caffe+OpenCV+Linux+GOTURN源码硬件平台：CRSN本科生实验室服务器--128G运行内存，3.2GCPU频率、英伟达1080p显卡、酷睿I7、8核处理器测试数据集：VOT2014公开数据集一、环境搭建1.OpenCV-2.4.9库安装1.1先从sourceforge上下载Ope

鱼丸小咖·2017-03-18 19:15

Learning to Track at 100 FPS with Deep Regression Networks 论文理解及应用笔记（一）

GOTURN算法论文翻译及理解云笔记前言：本笔记仅限个人算法理解与记忆，不涉及技术/论文相关商业用途。第一部分：个人根据原论文的翻译及笔记第二部分：个人根据论文及原算法的具体实现及应用迁移笔记摘要：机器学习技术经常由于他们通过大量训练数据提升性能的能力而被用于机器视觉方面。但不幸的是，大多数通用物体跟随算法都仍停留在在线训练并且没能从大量可用于离线训练的的可获取视频中获利。我们由此提出了一种离线训

鱼丸小咖·2017-03-18 18:59

论文理解：基于卷积神经网络的人脸识别方法

本文是对陈耀丹、王连明的基于卷积神经网络的人脸识别方法的理解。摘要：实现了一种基于卷积神经网络的人脸识别方法，该网络由两个卷积层，两个池化层、一个全连接层和一个softmax回归层组成，它能自动提取人脸特征并进行分类，网络通过批量梯度下降法训练特征提取器和分类器，各隐层应用“dropout”方法解决了过拟合问题，应用于ORL和AR人脸数据库的人脸识别率分别达到99.50%和99.62%，识别单张人

furuiyang_·2017-03-03 14:38

基于方向特征的识别论文理解

基于纹理分析方法，提取掌静脉图像的方向、频率、相位、幅度等纹理特征:这类方法大多借鉴掌纹识别方法，通过各种滤波器提取静脉图像纹理特征，编码纹理特征并进行匹配识别。它有3个核心步骤:滤波器选择、编码方式、匹配方式。对于滤波器的选择，现应用于掌脉的有正交高斯滤波器、多尺度匹配滤波器、Gabor滤波器等。而编码方式主要有竞争编码(competitivecode)，序数编码(ordinalcode)。最后

furuiyang_·2016-12-23 20:44

Iterative Quantization: A Procrustean Approach to Learning Binary Codes 论文理解及代码讲解

/liuheng0111/article/details/52242491IterativeQuantization:AProcrusteanApproachtoLearningBinaryCodes论文理解及代码讲解这篇文章发表在

mogu酱·2016-09-07 11:37

K-means Hashing： Learning Binary Compact Codes论文理解

/details/52242907K-meansHashing:anAffinity-PreservingQuantizationMethodforLearningBinaryCompactCodes论文理解

mogu酱·2016-09-07 11:25

论文理解（二）

forverydeepconvolutionalnetworksfornlp对于nlp中的任务，我们一般会采用RNN（尤其是lstm）和cnn网络，但是相比于计算机视觉中的神经网络是非常浅的。文章提出了一个新的结构，用于文本处理，作用于字符级别上，使用小的convlution和pooling操作（小，应该指的是卷积核和步长之类）。用了29层卷积层。这是深度卷积网络第一次用于NLP。‘nlp就是用不

rageidencenovy·2016-06-23 16:35

论文理解（一）树形lstm

LongShort-TermMemoryOverTreeStructures树结构的lstm中的记忆细胞可以通过递归的过程反映多个孩子及后代的历史信息。孩子节点之间是否有交互（图一）？提供一种特定的方法考虑不同等级上的长距离交互。例如语言和图像的解析结构。用s-lstm的记忆模块代替递归模型中的组合层，应用在通过语义组合来理解一段文本。句子的语义并不是线性的拼接，他是有结构的。与先前的lstm比s

rageidencenovy·2016-05-13 20:48

K-means hashing: An affinity-preserving quantization method for learning binary compact codes论文理解

用KMH(k-meanshashing)学习二值编码论文理解本篇论文[1]是微软研究院的何凯明等人提出，何凯明在微软2015年一年参与发表5篇CVPR，还有好多其他高质量论文，这篇论文是其2013年CVPR

悟道修炼中·2016-01-09 17:12

论文理解——基于骨骼的三维虚拟人运动合成方法研究

文章先介绍了运动数据，但是在我目前所做的实验中，数据都来源于CMU提供的ASF/AMC格式的运动数据重点部分是关键帧插值、时间和空间变形。最后一步是优先级重叠。关键帧插值以骨骼间夹角作为动作特征，根据运动特征将关键帧集合分类，采用分层插值方法，合成虚拟人运动序列。对于某一时刻前后两个关键帧的插值，平移和缩放采用线性插值，旋转过程采用球面线性插值。球面线性插值就是在四维空间的单位超球面上对两个

zb1165048017·2015-11-22 19:00

四元数插值matlab实现

看了几个关于关键帧提取和关键帧插值的论文，有几篇讲到了四元数插值这个概念关于欧拉角到四元数的转换，请看：刚体运动研究方法——欧拉角四元数接下来介绍四元数的插值公式以及matlab实现插值公式可以从论文论文理解

zb1165048017·2015-11-22 17:00

论文理解—基于独立时空特征空间的人体运动合成

原文题目——基于独立时空特征空间的人体运动合成文章提出人体运动的独立时空特征空间模型，利用一个可变形运动模型和独立特征子空间分析算法一区运动在时空两个域上的特征，并将其封装起来，通过低维空间进行描述，运动风格的编辑可利用低维运动混合和空时约束优化等方法来实现。人体运动风格是基本运动上的某种"细微变化"，具备三个特征：(1)运动风格是风格化运动与基本运动之间的差别。(2)这种差别表现

zb1165048017·2015-11-19 10:00

论文理解——从运动捕获数据中提取关键帧

论文提出了一种基于四元数距离的关键帧提取。首先注意两个计算公式：四元数距离和基于四元数的帧距离四元数距离：首先如何用一个四元数表示一个旋转呢？这里用到四元数与被旋转向量的叉乘。设原始向量为p，四元数为q=[s,V]=[w，x，y，,z]，那么将向量p按照四元数旋转q的结果即为：p'=[w,x,y,z][0,p][w,x,y,z]^(-1) (最后一项代表四元数的逆)【注】四元数的逆，其中，q的

zb1165048017·2015-11-17 16:00

Contour Detection and Hierarchical Image Segmentation 伯克利的一篇图像分割论文理解与学习

Contour Detection andHierarchical Image Segmentation笔记算法路线：gPb-------OWT------UCM每一部份的功能：1. gPb（global Pb）计算每一个pixel的作为boundary的可能性，即pixel的weight；2. OWT（Oriented Watershed Transform）将上述gPb的结果转换为多个闭合的

罗达志·2015-08-07 12:35

深度学习论文理解3：Flexible, high performance convolutional neural networks for image classification

本文是11年DanC.Ciresan的作品，主要贡献是提供了一种快速，全GPU部署的CNN计算框架，通过快速的GPU计算可以让作者尝试相对以前的神经网络更深的CNN，而且是仅仅使用监督学习的方式。本来不想写本文的总结的，但是最近看了ImageNet上取得好成绩的网络，都是通过GPU（caffe，convnet）部署，仅仅通过监督学习的方式来训练更加深的CNN，所以打算总结一下本文，作为在GPU上通

whiteinblue·2015-01-26 10:00

深度学习论文理解2:on random weights and unsupervised feature learning

本文是2010年斯坦福大学andrewng他们团队的作品；让人莫名其妙的是，本文有两个版本，两个版本略有差别版本1：http://www.icml2011.org/papers/551_icmlpaper.pdf ;2：http://web.stanford.edu/~asaxe/papers/Saxe%20et%20al.%20%202010%20%20On%20Random%20Weight

whiteinblue·2015-01-24 16:00

深度学习论文理解1：what is the best multi-stage architecture for Object Recognition

本文是09年，YannLeCun团队的一篇论文，论文主要讨论了卷积结构网络中各个layer的作用，进而探讨一个好的深度结构分类网络应该是什么样子的。摘要：在很多目标识别系统的特征提取阶段主要分为三部分：卷积，非线性变换和pooling本文提出三个问题：1.卷积层后的非线性变换如何应用分类准确率2.采用无监督学习的filter，或者监督学的filter比随机权值的filter分类效果更好？3.多阶段

whiteinblue·2015-01-24 11:00

Simultaneous Detection and Segmentation

SimultaneousDetectionandSegmentation（SDS）论文理解========================================================

Wanglan_Alan·2014-11-30 10:26

Weakly Supervised Object Recognition with Convolutional Neural Networks

WeaklySupervisedObjectRecognitionwithConvolutionalNeuralNetworksAuthors：MaximeOquab,IvanLaptev,LeonBottou,JosefSivic.论文理解

Wanglan_Alan·2014-11-28 09:26

learning and transferring mid-level image representations using convolutional neural networks

Learningandtransferringmid-levelimagerepresentationsusingconvolutionalneuralnetworksAuthors：MaximeOquab1,IvanLaptev,LeonBottou,JosefSivic.论文理解

Wanglan_Alan·2014-11-27 09:56

Canonical Trends 论文理解

论文题目：CanonicalTrends:DetectingTrendSettersinWebData 摘要：网络给我们提供了大量的信息，其中某一些信息被广泛的复制，转载或改述，这种现象被称之为趋势。web数据挖掘背景下的核心问题就是发现那些能够首次引领趋势的网络资源（如某一新闻事件）。论文中提出了一种简单，高效的方法来发现那些主导未来网络资源的趋势性资源，或者赶在其他网站之前识别那些发布与之相关

AriesSurfer·2012-09-04 20:00

推荐频道

论文理解

深度学习图像分类（二）——VGG论文理解

读论文太慢太累？唧唧堂阅读单了解一下！

深度学习图像分类（一）——AlexNet论文理解

[论文笔记] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

[论文笔记] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

轻量级模型：MobileNet V2

FPN-Feature Pyramid Networks论文理解

FPN-Feature Pyramid Networks论文理解

XNOR-Net论文理解

MTCNN 论文理解

Learning Compact Binary Descriptors with Unsupervised Deep Neural Networks论文理解

论文理解《Body Structure Aware Deep Crowd Counting》

Alpha Zero论文理解笔记

【论文理解】ArcFace: Additive Angular Margin Loss for Deep Face Recognition（InsightFace）

YOLOv2论文理解

论文理解：AlexNet(一)

论文理解 A Bayesian Hierarchical Model for Learning Natural Scene Categories

YOLOv2论文理解

论文理解：多任务学习及卷积神经网络在人脸识别中的应用

Learning to Track at 100 FPS with Deep Regression Networks 论文理解及应用笔记（二）

Learning to Track at 100 FPS with Deep Regression Networks 论文理解及应用笔记（一）

论文理解：基于卷积神经网络的人脸识别方法

基于方向特征的识别论文理解

Iterative Quantization: A Procrustean Approach to Learning Binary Codes 论文理解及代码讲解

K-means Hashing： Learning Binary Compact Codes论文理解

论文理解（二）

论文理解（一）树形lstm

K-means hashing: An affinity-preserving quantization method for learning binary compact codes论文理解

论文理解——基于骨骼的三维虚拟人运动合成方法研究

四元数插值matlab实现

论文理解—基于独立时空特征空间的人体运动合成

论文理解——从运动捕获数据中提取关键帧

Contour Detection and Hierarchical Image Segmentation 伯克利的一篇图像分割论文理解与学习

深度学习论文理解3：Flexible, high performance convolutional neural networks for image classification

深度学习论文理解2:on random weights and unsupervised feature learning

深度学习论文理解1：what is the best multi-stage architecture for Object Recognition

Simultaneous Detection and Segmentation

Weakly Supervised Object Recognition with Convolutional Neural Networks

learning and transferring mid-level image representations using convolutional neural networks

Canonical Trends 论文理解