E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【论文阅读笔记】
ASFormer:Transformer for Action Segmentation
论文阅读笔记
摘要为了解决动作分割类问题,作者设计了一个高效的基于transformer的动作分割任务模型,ASFormer,该模型具有以下三个特征:(i)由于特征的高局部性,作者明确地引入了局部连通性归纳先验。它将假设空间限制在一个可靠的范围内,有利于动作分割任务用较小的训练集学习适当的目标函数。(ii)作者应用了一个预定义的层次表示模式,可以有效地处理长输入序列。(iii)作者仔细设计了解码器,以细化来自编
Encounter84
·
2022-12-14 06:45
笔记
transformer
论文阅读
深度学习
论文阅读笔记
|Deep Image Homography Estimation
论文阅读笔记
|DeepImageHomographyEstimation前言4点参数化(The4-pointHomographyParameterization)数据集生成网络结构实验前言D.DeTone
金渐层猫
·
2022-12-14 03:37
Homography
Estimation
论文阅读笔记
|Unsuperised Deep Homography
论文阅读笔记
|DeepImageHomography:AFastandRobustHomographyEstimationModel前言无监督深度单应性模型A.模型输入(ModelInputs)B.张量直接线性变换
金渐层猫
·
2022-12-14 03:37
Homography
Estimation
2022交通预测
论文阅读笔记
前言很久没有读交通预测的论文,突然发现工作后还是要读读最新的论文,关注学术界最新的工作和动向,保持学习。看了几篇22年会议上最新的论文,记录下笔记,因为是泛读的,全文不涉及公式,只描述了论文的大致思想,读论文的顺序大致是:标题=>摘要=>模型图=>introduction=>方法(Methods)=>实验,这样读确实快很多。1.Event-AwareMultimodalMobilityNowcas
Bruce-XIAO
·
2022-12-13 16:07
【交通预测论文翻译】
网络
人工智能
深度学习
深入浅出了解GCN原理(公式+代码)
之后对GCN应用方面相关的
论文阅读笔记
,也会及时文末跟新。
Wisley.Wang
·
2022-12-13 10:28
GCN
神经网络
数据挖掘
机器学习
Learning To Count Everything(
论文阅读笔记
)
LearningToCountEverything论文地址:https://arxiv.org/abs/2104.08391源码:https://github.com/cvlab-stonybrook/LearningToCountEverything出处:CVPR2021作者单位:石溪大学,VinAI研究院一、摘要目前的计数工作主要集中于某种特定的类别,例如人、动物或者细胞。在这篇文章中,作者将
今天也学习了嗷
·
2022-12-12 12:49
论文阅读笔记
计算机视觉
机器学习
深度学习
A Purely Point-Based Framework (
论文阅读笔记
)
APurelyPoint-BasedFramework
论文阅读笔记
这是一篇ICCV2021年的文章,出自腾讯优图实验室。
今天也学习了嗷
·
2022-12-12 12:45
机器学习
人工智能
深度学习
自动驾驶之MultiPath++
论文阅读笔记
预测道路参与者的futurebehavior.摘要将输入由denseimage-basedencoding改为asparseencodingofheterogeneoussceneelements.即用polylines(折现)来描述roadfeatures和原始的agentstateinformation(例如位置、速度和加速度)。主要方法是对这些元素进行acontext-awarefusion
mathlxj
·
2022-12-11 20:50
自动驾驶
论文阅读
自动驾驶
深度学习
VSRN
论文阅读笔记
:Visual Semantic Reasoning for Image-Text Matching
论文地址:1909.02701v1.pdf(arxiv.org)代码地址:https://github.com/KunpengLi1994/VSRN我写这个博客的时候并没有看源代码,只是针对论文进行一个笔记记录,所以肯定会出现理解不到位情况,希望能帮到大家并且本文有什么错误请指出,因为我也在学习阶段,谢谢。本文提出了一个用于图像文本匹配的视觉语义推理网络。所采用的数据集为COCO和Flickr30
沈四岁
·
2022-12-11 20:21
论文阅读
论文阅读
计算机视觉
[
论文阅读笔记
19]Scalable multi-hop relational reasoning for knowledge-aware question answering
1.题目知识感知问答的可扩展性多跳关系推理模型FengY,ChenX,LinBY,etal.Scalablemulti-hoprelationalreasoningforknowledge-awarequestionanswering[J].2020.emnlp-main.99链接:https://arxiv.org/pdf/2005.00646.pdfGitHub项目地址:https://git
happyprince
·
2022-12-11 18:41
NER
深度学习
人工智能
机器学习
知识图谱
【
论文阅读笔记
KDD2021】《Relational Message Passing for Knowledge Graph Completion》
论文链接:https://arxiv.org/pdf/2002.06757.pdf代码和数据集:https://github.com/hwwang55/PathCon文章目录ABSTRACT1INTRODUCTION2PROBLEMFORMULATION3OURAPPROACH3.1RelationalMessagePassingFramework3.2RelationalContext3.3Re
葫芦哇
·
2022-12-11 18:06
知识图谱
知识图谱
深度学习
人工智能
手把手教你实现YOLOv3 (一)
1.引言最近整理了YOLO系列相关
论文阅读笔记
,发现仅仅靠阅读论文还是有很多内容一知半解,吃得不是很透彻.尽管网络上有很多博客都在讲解,但是很多实现细节细究起来还是有些困难.俗话说的好:Talkischeap.Showmethecode
赵卓不凡
·
2022-12-11 14:12
深度学习
计算机视觉
深度学习
目标检测
PSMNet学习记录:基于深度学习的双目立体匹配算法
翻译部分参考:
论文阅读笔记
《PyramidStereoMatching
Scurry﹉
·
2022-12-11 07:15
深度学习
【
论文阅读笔记
】CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning
本文是吴恩达哈佛大学团队在2017年发表的文章,提出CheXNet技术,即一个使用ChestX-ray14数据集训练的121层的深度卷积网络,该网络通过胸片识别肺炎的准确率已经和人类放射科医生持平甚至更高。网络输入为人体正面扫描的胸片,输入时患肺炎的概率,为了更好的可视化,使用了热力图(Classactivationmapping)。1.数据使用ChestX-ray14(2017),目前是最大的开
cskywit
·
2022-12-10 22:34
机器学习
论文阅读笔记
:(2021.10 CoRL) DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries
论文地址:DETR3D:3DObjectDetectionfromMulti-viewImagesvia3D-to-2DQueries|OpenReviewWeintroduceaframeworkformulti-camera3Dobjectdetection.Incontrasttoexistingworks,whichestimate3Dboundingboxesdirectlyfrommo
chaoqinyou
·
2022-12-10 18:29
感知
二分图匹配
深度学习
计算机视觉
目标检测
自监督
论文阅读笔记
Incremental-DETR:Incremental Few-Shot Object Detection via Self-Supervised Learning
增量少样本目标检测的目的是在不忘记基类知识的情况下检测出新类,只需从新类中提取少量标记的训练数据。之前的增量目标检测方法依赖于每个新类的丰富训练样本的可用性,这在很大程度上限制了新数据可能稀少的真实环境的可扩展性。Incremental-DETR(增量DETR):通过对DETR目标检测器进行微调和自监督学习来进行增量少样本目标检测。为了缓解使用少量新类数据导致的严重过拟合,首先通过使用选择性搜索作
YoooooL_
·
2022-12-10 18:28
论文阅读笔记
深度学习
人工智能
目标检测
计算机视觉
cnn
图像处理之目标检测入门总结
ps:由于之后可能会有一系列对象检测的
论文阅读笔记
,在论文阅读之前,先大致了解一下目前的研究现状,目标检测的各种主流方法的大致原理,以助于后面能更顺畅看懂论文,后续再
机器学习与AI生成创作
·
2022-12-10 17:11
算法
卷积
神经网络
计算机视觉
机器学习
PaperNotes(18)-VectorNet- Encoding HD Maps and Agent Dynamics from Vectorized Representation
自动驾驶
论文阅读笔记
11.PloylineGarph2.GlobalGraph3.模型目标函数4.Relatedwork5.Experiment5.1实验设置5.2消融实验5.3模型资源消耗5.4与其他模型的对比实验
小陈同学-陈百万
·
2022-12-10 07:20
PaperNotes
自动驾驶
机器学习
人工智能
【
论文阅读笔记
】Spatial Temporal Transformer Network for Skeleton-based Action Recognition
Author:ChiaraPlizzariChineseTitle:《基于骨架动作识别的时空Transformer网络》Classification:ActionRecProgress:FinishedPublication:ICPR2020ReadingDate:November24,2021Intro:多亏了3D姿态估计设别的优势,基于骨骼的动作识别近些年发展很快。但是对于提取上下文感知的细粒
Eric.Peng
·
2022-12-09 18:34
论文笔记
计算机视觉
深度学习
分类
RSGAN: Face Swapping and Editing using Face and Hair Representation in Latent Spaces
论文阅读笔记
论文原文地址:RSGAN:FaceSwappingandEditingusingFaceandHairRepresentationinLatentSpaces本文和上一篇FSNet极为相似,:FSNet:AnIdentity-AwareGenerativeModelforImage-basedFaceSwapping,有需要的小伙伴可以对照着看.摘要:RSGAN:使用潜在空间中的面部和头发表示进行
只会写bug的菜鸡
·
2022-12-09 16:43
论文阅读
AI换脸
计算机视觉
人工智能
深度学习
A CNN-Based Defect Inspection Method for Catenary Split Pins in High-Speed Railway-
论文阅读笔记
ACNN-BasedDefectInspectionMethodforCatenarySplitPinsinHigh-SpeedRailway基于CNN的高速铁路接触网开口销缺陷检测方法//2022.6.1717:18开始阅读笔记论文地址ACNN-BasedDefectInspectionMethodforCatenarySplitPinsinHigh-SpeedRailway|IEEEJourn
Dream_WLB
·
2022-12-09 15:25
研0基础沉淀
PVANET++
特征融合
缺陷检测
霍夫变换
Chan-Vese模型
论文阅读笔记
(3)——Translating Embeddings for Modeling Multi-relational Data
Abstract1IntroductionModelingmulti-relationaldataRelationshipsastranslationsintheembeddingspace2Translation-basedmodel3Relatedwork4Experiments4.1Datasets4.2Experimentalsetup4.3Linkprediction4.4Learnin
StriveQueen
·
2022-12-09 15:53
论文阅读笔记
人工智能
机器学习
论文阅读笔记
:A Fast Triangle-Triangle Intersection Test
论文:AFastTriangle-TriangleIntersectionTest作者:TomasMoller时间:2012.04.061.简介计算两个三角形是否相交的算法及优化。(碰撞检测算法)2.介绍碰撞检测算法:OBBTree(文章“OBBTree:AHierarchicalStructureforRapidInterferenceDetection”Cottschalk96)sphereh
shenyi0_0
·
2022-12-09 15:21
论文学习笔记
算法
几何学
论文阅读笔记
| 三维目标检测——PV-RCNN算法
如有错误,恳请指出。文章目录1.背景2.网络结构2.1FeatureEncoderandProposalGeneration2.2voxel-to-keypointsceneencoding2.3Keypoint-to-gridRoIFeatureAbstraction3.实验部分paper:《PV-RCNN:Point-VoxelFeatureSetAbstractionfor3DObjectD
Clichong
·
2022-12-09 15:43
#
三维点云论文
论文阅读
自动驾驶
3d检测
点云检测
PV-RCNN
论文阅读笔记
| 三维目标检测——CenterPoint算法
对于2d检测算法CenterNet,详细可以查看之前的笔记:
论文阅读笔记
|目标检测算
Clichong
·
2022-12-09 15:43
#
三维点云论文
自动驾驶
点云检测
感知算法
3d检测
CenterPoint
论文阅读笔记
| 三维目标检测——PV-RCNN++算法
如有错误,恳请指出。文章目录1.背景2.网络结构2.1SectorizedProposal-CentricSamplingProposal-CentricFilteringSectorizedKeypointSampling2.2VectorPoolAggregation3.实验结果paper:《PV-RCNN++:Point-VoxelFeatureSetAbstractionWithLocal
Clichong
·
2022-12-09 15:43
#
三维点云论文
点云检测
自动驾驶
感知算法
计算机视觉
pv-rcnn++
【
论文阅读笔记
】Noise2Noise: Learning Image Restoration without Clean Data
官方代码地址:https://github.com/NVlabs/noise2noise论文地址:https://arxiv.org/abs/1803.04189 第一次接触这方向,相当于翻译了。摘要 作者通过机器学习将基础统计推理应用于信号重建上:学习将损坏的观察结果(corruptedobservations)映射到干净信号上。作者从这个管道得到了一个简单且有力的结论:通过仅查看损坏样例来
时光机゚
·
2022-12-09 12:21
图像去噪
论文阅读
计算机视觉
深度学习
BoT-SORT与Strong-SORT论文对比及思考总结
BoT-SORT与Strong-SORT论文对比及思考总结接上篇BoT-SORT
论文阅读笔记
并对Strong-SORT论文研读与BoT-SORT的更新点对比有了以下的思考总结Strong-SORT论文Strong-SORT
mumuxi_c
·
2022-12-09 07:53
目标跟踪
深度学习
人工智能
深度学习
机器学习
目标跟踪
论文阅读笔记
《Learning Combinatorial Solver for Graph Matching》
核心思想 本文提出一种基于学习的组合求解器来实现图匹配。之前基于学习的图匹配方法都是利用神经网络提取特征构建关联矩阵,然后再利用可微分的Sinkhorn算法求解匹配矩阵。但本文提出的方法没有显式的构建关联矩阵和求解匹配矩阵的过程,而是将其转化成关联图(assignmentgraph),然后预测关联图中节点标签。整个编码解码和预测过程都是利用图神经网络实现的,充分利用了图强大的关联归纳偏好。实现过
深视
·
2022-12-09 07:04
图匹配
论文阅读笔记
论文阅读
图匹配
深度学习
2021-Channel and spatial attention based deep object co-segmentation
论文阅读笔记
Introduction输入任意大小;孪生网络编码器:DeeplabV3+resnet-50通道注意操作对于增强包含公共对象特征的通道是必要的。平均池化+最大池化高层特征提取语义,低层特征提取细节信息;本文贡献:平均池化和最大池化都用于注意力机制;将注意力机制也用于低层特征;Relatedwork基于深度学习的协同分割论文[34]P.Mukherjee,B.Lall,S.Lattupally,Ob
jindayue
·
2022-12-08 22:18
深度学习
神经网络
计算机视觉
DSSD:Deconvolutional Single Shot Detector
论文阅读笔记
1.动机2.贡献点特点:DSSD将SSD的VGG网络用Resnet-101进行了替换,在分类回归之前引入了残差模块,在SSD添加的辅助卷积层后又添加了反卷积层形成“宽-窄-宽”的“沙漏”结构。DSSD相比SSD的一个最大的提升在于对小目标的检测度上DSSD有了很大的提升。缺点:DSSD的检测速度相比SSD慢了很多,很大一部分原因在于引入的Resnet-101太深,同时也因为引入了额外的层----p
philipwelia
·
2022-12-08 16:44
论文笔记
卷积
计算机视觉
人工智能
深度学习
python
【
论文阅读笔记
】SSD:Single Shot MultiBox Detector
地址:SSD:SingleShotMultiBoxDetector时间:2015年12月发布,2016年12月最终全文概括 SSD引入了FasterRCNN的anchor,使用多level的featuremap来进行分类和回归,从而增强多尺度的语义信息(SSD应用在不同尺度的feature上)。 在VOC2007test数据集上,SSD达到74.3%74.3\%74.3%的mAP及595959
时光机゚
·
2022-12-08 16:14
目标检测
深度学习
论文
读书笔记
ICCV 2021 | LeViT: a Vision Transformer in ConvNet‘s Clothing for Faster Inference
论文阅读笔记
论文:https://arxiv.org/abs/2104.01136代码(刚刚开源):https://github.com/facebookresearch/LeViTABSTRACT我们设计了一系列的图像分类体系结构,在优化精度和效率之间权衡。我们的工作利用了基于最新发现注意力的架构,该架构在高度并行处理硬件上具有竞争力。我们回顾了许多文献中的卷积神经网络原理,将其应用于transformer
tiantianwenwen
·
2022-12-08 15:11
计算机视觉
Cvae-gan: fine-grained image generation through asymmetric training
论文阅读笔记
论文原文地址:CVAE-GAN:fine-grainedimagegenerationthroughasymmetrictraining推荐阅读:VAE全面理解生成模型——变分自编码器VAE从GANVAE到CVAE-GAN摘要:我们提出了变分生成对抗性网络,这是一个将变分自动编码器与生成对抗性网络相结合的通用学习框架,用于合成精细的图像,例如类别中特定人员或对象的脸。我们的方法将图像建模为概率模型
只会写bug的菜鸡
·
2022-12-08 12:15
论文阅读
AI换脸
视频换脸
【
论文阅读笔记
】Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs
RepLKNet代码地址GithubRepLKNet论文地址Arixiv有效感受野论文地址Arxiv论文总结 本文设计的网络名为RepLKNet(ReparamLargeKernelNetwork),其证明了少量的大kernel卷积可以获得比堆叠小kernel卷积的网络架构设计更好的效果。RepLKNet使用的最大卷积核大小为31∗31\mathbf{31}*\mathbf{31}31∗31,是
时光机゚
·
2022-12-08 12:56
论文
读书笔记
深度学习
人工智能
计算机视觉
【
论文阅读笔记
】Pyramid Real Image Denoising Network
论文简介 本文是19年的论文,网络名为PRIDNet。代码地址为https://github.com/491506870/PRIDNet。在1080ti上,PRIDNet处理512x512图像需要大约50ms; 尽管深度卷积神经网络在特定噪声和去噪方面展示出非凡能力,但对于真实世界的噪声图像仍然表现不佳。主要原因在于真实世界的噪声更加复杂和多样化。为了解决盲去噪问题,本文提出了一种“金字塔真实
时光机゚
·
2022-12-08 12:56
图像去噪
论文阅读
【
论文阅读笔记
】ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks
论文地址:ECA-Net论文代码:https://github.com/BangguWu/ECANet论文总结 ECA-Net是基于SE-Net的扩展,其认为SEblock的两个FC层之间的维度缩减是不利于channelattention的权重学习的,这个权重学习的过程应该直接一一对应。作者做了一系列实验来证明在attentionblock中保持channel数不变的重要性。 ECA-Net的
时光机゚
·
2022-12-08 12:26
深度学习
论文
读书笔记
【
论文阅读笔记
】NTIRE 2022 Burst Super-Resolution Challenge
论文简介 连拍超分辨率(BrustSuper-Resolution)近年来因其在移动摄影中的应用而受到越来越多的关注。通过合并来自场景的多个移位图像的信息,连拍超分辨率算法旨在恢复细节,否则无法使用简单的输入图像获得这些细节。在挑战中,参与者的任务是生成清晰的RGB图像,分辨率提高4倍,将14张连续的RAW噪声突发作为输入。也就是说,这些方法需要执行联合去噪、去马赛克和超分辨率。NTIRE202
时光机゚
·
2022-12-08 12:26
超分辨率
论文阅读
计算机视觉
人工智能
【
论文阅读笔记
】A review of the deep learning methods for medical images super resolution problems
摘要 医疗图像中分辨率的限制来源于:图像采集次数的限制,由于硬件限制导致的低辐射(Lowirradiation)等。 这篇综述应该比较基础,从深度学习->超分网络架构->再到医疗图像超分问题的介绍。对于医疗方向的介绍可能较少。论文简介 相较于自然图像SR,医疗图像SR需要额外的先验信息才能用于特定应用。医学图像的数据集相对较小且难以收集,尤其是对于临床高分辨率和低分辨率图像对。在文末的时候,
时光机゚
·
2022-12-08 12:24
超分辨率
深度学习
论文阅读
计算机视觉
论文阅读笔记
《Few-Shot Class-Incremental Learning》
小样本学习&元学习经典论文整理||持续更新核心思想 本文提出一种用于解决小样本类别增量学习(few-shotclass-incrementallearning,FSCIL)的算法(TOPIC)。首先解释一下什么是小样本类别增量学习,模型首先在一个大规模的基础数据集D(1)D^{(1)}D(1)上进行训练,然后会不断增加新的数据集D(t),t>1D^{(t)},t>1D(t),t>1,且数据集中的
深视
·
2022-12-08 12:40
论文阅读笔记
#
小样本学习
深度学习
小样本学习
增量学习
NG网络
Image Matching:SuperGlue
论文阅读笔记
写在前面SLAM这个领域有着极其详细的子领域划分,理论上是任何一个子部分都可以使用深度特征学习代替的,差别是谁代替的更加优雅superglue声称使用深度特征代替的是关键点的匹配部分,注意只生成关键点的匹配关系,根据此匹配关系生成单应矩阵或者位姿的过程需要RANSAC(随机采样一致性)或者DLT(直接线性变换)作者讲解:最新CVPR2020论文:SuperGlue(超级胶水):用图神经网络来做图像
是魏小白吗
·
2022-12-08 09:25
图像匹配
论文阅读笔记
(9):加权稀疏子空间表示——子空间聚类、约束聚类和主动学习的统一框架
论文阅读笔记
(9):WEIGHTEDSPARSESUBSPACEREPRESENTATION——AUNIFIEDFRAMEWORKFORSUBSPACECLUSTERING,CONSTRAINEDCLUSTERING
塔_Tass
·
2022-12-08 07:34
聚类
算法
机器学习
论文阅读笔记
(15):Deep Subspace Clustering with Data Augmentation,深度子空间聚类+数据增强
论文阅读笔记
(15):DeepSubspaceClusteringwithDataAugmentation,深度子空间聚类+数据增强摘要1介绍2相关工作带增强的聚类方法具有一致性损失的自监督子空间聚类中的自表达模型
塔_Tass
·
2022-12-08 07:34
机器学习
深度学习
聚类
时序动作检测/定位(Temporal Action Detection)(Temporal Action Localization)-约40篇
论文阅读笔记
1时序动作检测(TemporalActionDetection)(TemporalActionLocalization)-综述介绍1介绍2介绍3(老)综述2数据集介绍THUMOS14(时序动作检测)(本实验采用)THUMOS14测试集(用于可视化)单个视频THUMOS14的np文件THUMOS14的光流文件(google)或者THUMOS14的光流文件(腾讯云)EPIC-KITCHENS-100A
Louis210
·
2022-12-08 05:53
cv
人工智能
【SLAM
论文阅读笔记
】Multi-modal Semantic SLAM for Complex Dynamic Environments
Multi-modalSemanticSLAMforComplexDynamicEnvironments复杂动态环境下多模态语义SLAM发布期刊或者会议2022.5.10发布在arxiv上南洋理工大学背景目前SLAM技术是机器人应用领域最重要的技术之一。缺点是当前SLAM系统主要面向静态场景。目前语义SLAM的出现提高机器人对环境的理解,同时能通过图像分割来区分动态信息。但是目前语义分割存在分割不
sugarkss
·
2022-12-08 01:30
SLAM
paper
机器学习
人工智能
计算机视觉
论文阅读笔记
《Few-shot Classification via Adaptive Attention》
小样本学习&元学习经典论文整理||持续更新核心思想 本文提出一种基于注意力机制的小样本学习算法。作者认为基于参数优化的元学习算法优化过程过于复杂,而基于度量学习的小样本学习算法,虽然更加简单有效,但缺少对于新任务的适应能力。本文利用注意力机制根据支持集图像的特征图和查询集图像的特征图,得到对应的注意力图(AttentionMaps),将注意力图与查询集图像的特征图做逐元素相乘,得到了优化后的特征
深视
·
2022-12-07 23:23
论文阅读笔记
#
小样本学习
深度学习
小样本学习
注意力机制
Poseur: Direct Human Pose Regression with Transformers
论文阅读笔记
Poseur:使用Transformer的直接人体姿态回归ECCV2022论文链接代码链接摘要:本文提出一种直接的、基于回归的方法从单个图像中估计2D人体姿态。本文将姿态估计问题表述为一个序列预测任务(sequencepredictiontask),并使用Transformer来解决。本文提出的网络无需借助热图这样的中间表示,直接学习从图像到关键点坐标的回归映射。这种方法避免了热图法的许多复杂性。
AnZhiJiaShu
·
2022-12-07 20:19
论文阅读
计算机视觉
深度学习
Wing Loss
论文阅读笔记
WingLossforRobustFacialLandmarkLocalisationwithConvolutionalNeuralNetworks论文链接:https://arxiv.org/abs/1711.06753一、ProblemStatement对于人脸关键点检测,作者对比了L1,L2,Smooth-L1Loss,发现它们在大误差下表现的很好,但是在小误差下,或者中等区域的误差下,表现
Tianchao龙虾
·
2022-12-07 19:46
损失函数
深度学习
人工智能
机器学习
[
论文阅读笔记
58]Learning from Noisy Labels with Deep Neural Networks:A Survey
1.题目LearningfromNoisyLabelswithDeepNeuralNetworks:ASurvey作者团队:韩国科学技术院(KAIST)SongH,KimM,ParkD,etal.LearningfromNoisyLabelswithDeepNeuralNetworks:ASurvey.2020.2.摘要重述问题:从监督学习的角度来描述使用标签噪声学习的问题;方法回顾:对57种最先
happyprince
·
2022-12-07 17:13
算法
深度学习
深度学习
机器学习
人工智能
Medical Transformer
论文阅读笔记
这是arxiv上的一篇文章,文章作者:目前用卷积神经网络来做图像分割虽然也能取得一些好效果,然而卷积神经网络无法对长依赖进行建模,虽然后续提出了一些弥补的trick如注意力机制等,仍然无法完全解决这个问题。而transformer以能够建模长依赖著称,几个月前更是有篇用transformer做图像分类的文章横空出世,在大量数据集训练的条件下取得了比卷积神经网络更好的准确率。文章提出了用transf
sysu_first_yasuo
·
2022-12-07 13:50
论文阅读笔记
深度学习
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他