变化检测论文解读第8页

DINO学习

qq_478377515·2023-10-06 10:17

《论文阅读》监督对抗性对比学习在对话中的情绪识别 ACL2023

你是否也像我之前搜索论文解读，得到只是中文翻译的解读后感到失望？小白如何从零读懂论文？和我一起来探索吧！今天为大家带来的是《SupervisedAdversarialContrastiveL

365JHWZGo·2023-10-05 08:00

--人行论文解读下篇

上一篇（https://www.jianshu.com/p/7c3918f7fbba）笔者向大家解读第一部分，主要对区块链技术的经济学解释。本篇为你解读完成。三、区块链的经济功能3.1区块链的主要应用方向区块链的主要应用方向解读：将区块链应用分成了4类：1，应用不涉及Token：以联盟链为代表，比如银行之间利用区块链技术做清算2，以Token代表区块链外的资产或权利：比如在供应链金融和数字票据等场

jerry的技术与思维·2023-10-05 05:48

GPT系列论文解读：GPT-2

GPT系列GPT（GenerativePre-trainedTransformer）是一系列基于Transformer架构的预训练语言模型，由OpenAI开发。以下是GPT系列的主要模型：GPT：GPT-1是于2018年发布的第一个版本，它使用了12个Transformer编码器层和1.5亿个参数。GPT-1的训练数据包括了互联网上的大量文本。GPT-2：GPT-2于2019年发布，是GPT系列的

青云遮夜雨·2023-10-05 00:43

K-BERT论文解读

一、前言这篇文章将bert同knowledgegraph（KG）结合在一起。一解决了Heterogeneousembeddingspace问题（KG的实体向量与wordembedding不连续的问题。）解决了knowledgeNoise知识噪音.北大的团队一直有做KG的，上次在EMNLP中看到的一个本科生还是硕士？就是做了一个KG局部更新方法，使得KG能够更快速的更新知识。这次的这篇论文就把BER

LemonLee·2023-10-04 09:23

dm-vio-ros的安装（详细）

前言dm-vio安装参考博客【SLAM】DM-VIO(ros版)安装和论文解读在安装过程中，有些地方提示的不是很清楚，故写一篇记录避免再次犯错。

~山有木兮·2023-10-03 17:29

SentenceTransformer 之论文解读

摘要原文标题：Sentence-BERT:SentenceEmbeddingsusingSiameseBERT-Networks链接：https://arxiv.org/pdf/1908.10084.pdf尽管Bert和RoBERTa在句子对回归任务上，例如语义文本相似度（SemanticTextSimilarity），取得了新的sota结果。但是，需要将两个句子都输入到模型中，造成较大的计算延时

xiao4816·2023-10-02 13:37

Lenet5经典论文解读

【嵌牛鼻子】Lenet-5经典论文解读【嵌牛正文】一论文

Daniel_go·2023-10-02 10:30

KDD 2019论文解读：多分类下的模型可解释性

reference:https://developer.aliyun.com/article/715920简介：日前，由阿里巴巴研究型实习生张雪舟、蚂蚁金服高级算法专家娄寅撰写的论文《AxiomaticInterpretabilityforMulticlassAdditiveModels》入选全球数据挖掘顶级会议KDD2019。日前，由阿里巴巴研究型实习生张雪舟、蚂蚁金服高级算法专家娄寅撰写的论文

婉妃·2023-10-02 03:40

目标检测学习笔记3——Yolo1 Yolo论文解读

文章目录1.引言2.Yolov1论文摘要1.介绍2.一个统一的目标检测框架2.1网络设计2.2训练阶段2.3推断预测阶段2.3Yolo的缺陷3.一些数据对比1.引言Yolo1,2,3的作者是JosephRedmon.Yolo是one-stage算法，即无需提取候选框、没有复杂的上下游处理工作，而是图片输入后经过网络，一次性往前推段得到boundingbox的定位以及分类结果。是端到端训练优化。优点

Shadownow·2023-10-01 01:31

目标检测论文解读5——YOLO v1

angmaodie3396·2023-10-01 01:00

【空间-光谱联合注意网络：多时相遥感图像】

ASpatial–SpectralJointAttentionNetworkforChangeDetectioninMultispectralImagery（一种用于多光谱图像变化检测的空间-光谱联合注意网络

小郭同学要努力·2023-09-30 08:26

卢之·2023-09-29 01:23

基于MATLAB的数字图像处理（三）——地物提取与变化检测

在图像处理上，常常使用各种指数，例如：归一化差分植被指数归一化差分水体指数如何通过MATLAB实现通过各类指数提取对应地物，是遥感图像处理中常见的问题。使用各类指数时，一般先对整幅图像求归一化差分指数，之后通过设定阈值来对目标与非目标进行区分。如果在已经知道经验阈值的前提下，可以直接使用循环嵌套来提取目标。这里举例说明，以建筑物提取为例。在大面积遥感影像中，使用NDBI区分裸土与建筑略显困难，计算

SkyStarfall·2023-09-27 12:19

[博学谷学习记录] 超强总结，用心分享|Pyspark基础入门1

陈万君Allen·2023-09-26 14:52

【论文解读】RALM：微信看一看中基于Attention机制的实时Look-alike推荐模型

前段时间读了来自微信团队发表在KDD2019上的一篇论文《Real-timeAttentionBasedLook-alikeModelforRecommenderSystem》，简称是RALM，主要介绍的是一种将Attention机制与look-alike模型结合后的实时推荐模型，这个算法目前应用在了微信“看一看”模块上。在读论文的过程中产生了许多疑问，也查找了不少资料。因为网上对这篇论文的解读不

_王子段·2023-09-26 02:35

Vision Transformer(ViT)论文解读与代码实践(Pytorch)

VisionTransformerVisionTransformer（ViT）是一种基于Transformer架构的神经网络模型，用于处理计算机视觉任务。传统的计算机视觉模型如卷积神经网络（CNN）在处理图像任务时取得了很大的成功，但CNN存在一些局限，例如对于长距离依赖的建模能力较弱。ViT通过引入Transformer的注意力机制来解决这些问题，并在一些视觉任务上取得了优秀的结果。与传统的CN

青云遮夜雨·2023-09-24 21:30

《Cascaded Pyramid Network for Multi-Person Pose Estimation》--旷世2017COCO keypoints冠军论文解读

简介《CascadedPyramidNetworkforMulti-PersonPoseEstimation》，这是Face++旷世科技2017年取得COCOKeypointsChallenge冠军的文章，主要目的是解决inthewild场景下多人的姿态估计，即关键点回归。这里对这篇文章做一个简单的总结，如有理解不对的地方，欢迎指正！！文章的主要贡献是：重点内容1提出了一种金字塔型的串接模型，即C

zhangboshen·2023-09-24 11:34

数据库顶会 VLDB 2023 论文解读 - Krypton: 字节跳动实时服务分析 SQL 引擎设计

“Krypton源于DC宇宙中的氪星，它是超人的故乡，以氪元素命名”。引言近些年，在复杂的分析需求之外，字节内部的业务对于实时数据的在线服务能力也提出了更高的要求。大部分业务不得不采用多套系统来应对不同的Workload，虽然能满足需求，但也带来了不同系统数据一致性的问题，多个系统之间的ETL也浪费了大量的资源，同时对于研发人员来讲，也不得不学习维护多套系统。为了解决这个问题，我们开启了Krypt

字节跳动云原生计算·2023-09-24 10:02

论文解读：多任务学习之PLE算法

多任务学习之PLE算法一、背景1.1、为什么要多目标建模1.2、业界做法二、论文方案2.1、CGC结构2.2、PLE结构2.3、损失函数三、实验效果3.1、线上A/Btest3.2、不同相关性任务的效果3.3、MMoE和PLE不同experts网络的输出一、背景在推荐领域，多目标已经成为了业界的主流，各大公司的各种业务场景，基本都是基于多目标的框架来搭建推荐系统。然而在现有的多目标模型中，很难同时

ybjlucky·2023-09-24 06:38

【DDPM论文解读】Denoising Diffusion Probabilistic Models

0摘要本文使用扩散概率模型合成了高质量的图像结果，扩散概率模型是一类受非平衡热力学启发的潜变量模型。本文最佳结果是通过根据扩散概率模型和朗之万动力学的去噪分数匹配之间的新颖联系设计的加权变分界进行训练来获得的，并且本文的模型自然地承认渐进式有损解压缩方案，该方案可以解释为自回归解码的推广。在CIFAR10数据集上，本文都获得了不错的分数。本文github链接：https://github.com/

AI 菌·2023-09-23 21:10

多语言多模态（融合图像和文本）大模型-mPLUG-Owl论文解读

近期复现了mPLUG-Owl，效果提升了好几个点，特来精读一番：感谢大佬们的工作：论文名称：mPLUG-Owl:ModularizationEmpowersLargeLanguageModelswithMultimodality论文地址：https://arxiv.org/pdf/2304.14178.pdfgithub地址：https://github.com/X-PLUG/mPLUG-Owl1

samoyan·2023-09-23 19:49

AI数字人：最强声音驱动面部表情模型VideoReTalking

目录1VideoReTalking论文解读1.1介绍1.2相关工作1.2.1视频编辑中的音频配音1.2.2基于音频的单图像面部动画1.3框架1.3.1语义引导重演网络1.3.2口型同步网络1.3.3身份感知增强网络

智慧医疗探索者·2023-09-22 22:29

车道线检测算法LaneNet + H-Net（论文解读）

本文将对论文TowardsEnd-to-EndLaneDetection:anInstanceSegmentationApproach进行解读。这篇论文是于2018年2月挂在arxiv上的。文中提出了一种端到端的车道线检测算法，包括LaneNet和H-Net两个网络模型。其中，LaneNet是一种将语义分割和对像素进行向量表示结合起来的多任务模型，负责对图片中的车道线进行实例分割；H-Net是由卷

liyonghong·2023-09-22 15:59

【论文解读】——基于多尺度卷积网络的遥感目标检测研究（姚群力，胡显，雷宏）

【论文解读】——基于多尺度卷积网络的遥感目标检测研究（姚群力，胡显，雷宏）该文针对现有遥感图像目标检测算法对于复杂场景下多尺度目标检测精度较低、泛化能力差的问题，提出了一种多尺度卷积神经网络遥感目标检测框架

醪糟小丸子·2023-09-22 15:01

InstructPix2Pix（CVPR2023）-图像编辑论文解读

文章目录1.摘要2.背景3.算法3.1生成多模态训练集3.1.1生成指令及成对caption3.1.2依据成对的caption生成成对的图像3.2InstructPix2Pix4.实验结果4.1基线比较4.2消融实验5.结论论文：《InstructPix2Pix:LearningtoFollowImageEditingInstructions》github：https://github.com/t

‘Atlas’·2023-09-21 20:52

【论文解读】Faster sorting algorithm

一、简要介绍基本的算法，如排序或哈希，在任何一天都被使用数万亿次。随着对计算需求的增长，这些算法的性能变得至关重要。尽管在过去的2年中已经取得了显著的进展，但进一步改进这些现有的算法路线的有效性对人类科学家和计算方法都是一个挑战。在这里，论文展示了人工智能是如何通过发现迄今为止未知的算法路线来超越目前的最先进的方法。为了实现这一点，论文将一个更好的排序程序制定为单人游戏的任务。然后，论文训练了一个

合合技术团队·2023-09-20 21:16

论文解读 | Transformer 原理深入浅出

Attention机制由Bengio团队于2014年提出，并广泛应用在深度学习的各个领域。而Google提出的用于生成词向量的Bert在NLP的11项任务中取得了效果的大幅提升，Bert正是基于双向Transformer。Transformer是第一个完全依赖于Self-Attention来计算其输入和输出表示的模型，而不使用序列对齐的RNN或CNN。更准确的讲，Transformer由且仅由se

随时学丫·2023-09-19 23:41

【论文解读】Faster sorting algorithm

一、简要介绍基本的算法，如排序或哈希，在任何一天都被使用数万亿次。随着对计算需求的增长，这些算法的性能变得至关重要。尽管在过去的2年中已经取得了显著的进展，但进一步改进这些现有的算法路线的有效性对人类科学家和计算方法都是一个挑战。在这里，论文展示了人工智能是如何通过发现迄今为止未知的算法路线来超越目前的最先进的方法。为了实现这一点，论文将一个更好的排序程序制定为单人游戏的任务。然后，论文训练了一个

·2023-09-19 12:47

论文解读 | YOLO系列开山之作：统一的实时对象检测

原创|文BFT机器人01摘要YOLO是一种新的目标检测方法，与以前的方法不同之处在于它将目标检测问题视为回归问题，同时预测边界框和类别概率。这一方法使用单个神经网络，可以从完整图像中直接预测目标边界框和类别概率，实现端到端的性能优化。YOLO的速度非常快，基本模型每秒可以处理45帧图像，而快速版本每秒可处理155帧，同时仍然具有很高的准确率。虽然在定位方面可能会产生一些误差，但不太可能出现背景误报

BFT白芙堂·2023-09-18 23:39

论文解读 | 基于视觉的水果采摘机器人识别与定位方法研究进展

原创|文BFT机器人01背景在复杂的农业环境中，利用机器视觉及其相关算法可以提高收割机器人的效率、功能性、智能化和远程互动性。对于水果采摘机器人系统来说，主要的挑战包括免提导航和水果定位，以及大多数果园中常见的崎岖地形和大型障碍物。这些挑战会在移动采摘机器人穿越地形时在其视觉系统中引起严重的振动，因此需要采用动态目标跟踪和自动图像去模糊算法。研究人员通过在视觉识别和位置检测方面取得进展来解决这些挑

BFT白芙堂·2023-09-16 07:59

文章引言---森林干扰--isprs

1、面向土地利用变化检测的多算法土地利用变化被描述为人类如何使用地球表面的变化（例如，用于农业、种植园、牧场、管理的森林、保护、定居点或将其作为自然生态系统单独存在）。

凉风之林·2023-09-15 06:52

Transformer Decoder详解

这两天在学习Transformer，看了李沐的论文解读和NLP从入门到放弃，看完这两个视频算是大致明白了Transformer的结构。

思考实践·2023-09-15 03:48

《论文阅读》常识感知的提示用于可控的同情对话生成 2023 AAAI

你是否也像我之前搜索论文解读，得到只是中文翻译的解读后感到失望？小白如何从零读懂论文？和我一起来探索吧！今天为大家带来的是《Commonsense-AwarePromptingforControlla

365JHWZGo·2023-09-14 18:53

数据库顶会 VLDB 2023 论文解读：字节跳动如何解决超大规模流式任务运维难题

本文解读了新加坡国立大学马天白教授团队、字节跳动基础架构-计算-流式计算团队联合发表在国际数据库与数据管理顶级会议VLDB2023上的论文“StreamOps:Cloud-NativeRuntimeManagementforStreamingServicesinByteDance”，介绍字节跳动内部基于数万Flink流式任务管理实践所提炼出的一个流式任务运行时管控解决方案，有效解决流式作业运行期间

字节跳动云原生计算·2023-09-14 06:39

论文解读 | MVSNet：非结构化多视图立体的深度推理

原创|文BFT机器人这篇论文的题目是《MVSNet:DepthInferenceforUnstructuredMulti-viewStereo》。这是一篇关于深度学习在多视角立体视觉（MVS）中的应用的研究论文。MVS任务的目标是从多个视角的图像中还原出三维场景的深度信息，从而实现准确的三维重建。本文提出了一个名为MVSNet的深度学习架构，该架构能够实现端到端的深度估计，为MVS任务带来了显著的

BFT白芙堂·2023-09-13 19:26

Segment Anything Model(SAM)论文解读

一、引言在这项工作中，作者的目标是建立一个图像分割的基础模型。也就是说，寻求开发一个提示模型，并使用一个能够实现强大泛化的任务在广泛的数据集上对其进行预训练。有了这个模型，使用即时工程解决新数据分布上的一系列下游分割问题。该计划的成功取决于三个组成部分:任务、模型和数据。为了开发它们，作者解决了以下关于图像分割的问题:1、什么任务可以实现zero-shot泛化?2、相应的模型体系结构是什么?3、哪

小小小~·2023-09-13 09:47

【AI理论学习】语言模型Performer：一种基于Transformer架构的通用注意力框架

语言模型Performer：一种基于Transformer架构的通用注意力框架Performer论文解读RegularAttentionMechanismFAVOR+：通过矩阵相关性实现快速注意力Attention

镰刀韭菜·2023-09-12 10:26

【论文解读】元学习：MAML

一、简介元学习的目标是在各种学习任务上训练模型，这样它就可以只使用少量的训练样本来解决新任务。论文所提出的算法训练获取较优模型的参数，使其易于微调，从而实现快速自适应。该算法与任何用梯度下降训练的模型兼容，适用于各种学习问题，包括分类、回归和强化学习。论文中表明，该算法在few-shotimageclassification基准上达到了SOTA的性能，在few-shotregression上也产出

Scc_hy·2023-09-12 06:57

论文解读 | 用于3D对象检测的PV-RCNN网络原创

原创|文BFT机器人01背景本文的背景涉及到3D物体检测，这是一个在自动驾驶和机器人等领域应用广泛的重要问题。在这些领域，LiDAR传感器被广泛用于捕捉3D场景信息，生成不规则且稀疏的点云数据。这些点云数据提供了理解和感知3D场景的关键信息。然而，由于点云数据的不规则性和稀疏性，从中提取有用的特征并进行准确的物体检测是一项具有挑战性的任务。因此，本文提出了一种新颖的点-体积综合网络框架，旨在提高3

BFT白芙堂·2023-09-12 06:51

Side Window Filtering 论文解读和C++实现

SideWindowFiltering刚开始看到这篇论文的时候，我就很感兴趣想去复现一把看看效果。这篇论文是今年CVPRoral且不是深度学习方向的，其核心贡献点就是：不管原来的滤波器保不保边，运用了side-window思想之后，都可以让它变成保边滤波！于是利用业余时间，参考作者开源的matlab代码，我用C++实现了一下Side-window盒子滤波，其他滤波器有时间再试下，下面是github

梁德澎·2023-09-12 02:31

Distortion-Free Wide-Angle Portraits on Camera Phones论文解读

一、背景手机端的摄像技术近年来发展迅猛，各大厂商都推出广角甚至超广角镜头的手机，广角镜头视野更广，尤其在合影时能够拍摄到更多的人，但是位于边缘的人像被投影到平面后明显能看到被拉伸变形，向两侧扩展，尤其是人脸更加的明显，这篇论文提出了一种新的方法让边缘人像不再畸变，拍照不用抢C位。透视投影(PerspectiveProjection)。从一个投射中心出发，把一个3D物体投在2D表面上。忠于透视原理，

JKANG94·2023-09-11 08:01

【多模态论文解读】Align before Fuse: Vision and Language Representation Learning with Momentum Distillation

AlignbeforeFuse:VisionandLanguageRepresentationLearningwithMomentumDistillationName:ALBEFKeywords:Multimodal;ContrastiveLearning;KnowledgeDistillationYear:2021Source:NeurIPSPaper:https://arxiv.org/abs

Marlowee·2023-09-09 15:45

论文解读 | 基于中心的三维对象检测与跟踪

原创|文BFT机器人CenterPoint与传统基于框的3D物体检测器和跟踪器不同之处在于，它将3D物体表示、检测和跟踪为点，而不是使用边界框。这种方法具有几个优点，包括减少物体检测器的搜索空间，简化下游任务（如跟踪），并使设计比以前的方法快得多的有效的两阶段细化模块成为可能。此外，CenterPoint允许骨干网络学习物体的旋转不变性和它们相对旋转的旋转等变性。检测是一种简单的经过细化的局部峰提

BFT白芙堂·2023-09-09 09:24

架构简析| 一种Generative Agents

GenerativeAgents架构简析斯坦福《GenerativeAgents:InteractiveSimulacraofHumanBehavior》论文解读。

1m6·2023-09-09 02:25

TTS | VocGAN声码器训练自己的数据集

原文VocGAN:AHigh-FidelityReal-timeVocoderwithaHierarchically-nestedAdversarialNetwork想要论文解读，请参考我的这篇文章~本博客主要包括以下内容

夏天｜여름이다·2023-09-08 18:29

论文解读 | KPConv——点云上的可形变卷积网络

原创|文BFT机器人《KPConv:FlexibleandDeformableConvolutionforPointClouds》是一篇发表于2019年的研究论文，作者为HuguesThomas、CharlesR.Qi、Jean-EmmanuelDeschaud、BeatrizMarcotegui和FrançoisGoulette。这篇论文关注于点云数据上的卷积操作，提出了一种名为KPConv的卷

BFT白芙堂·2023-09-08 08:20

论文解读 | 点对照：3D点云理解无监督式预训练

原创|文BFT机器人《PointContrast:UnsupervisedPre-trainingfor3DPointCloudUnderstanding》是一篇关于三维点云数据理解领域的研究论文，旨在提出一种无监督预训练方法，以改善对三维点云数据的理解。01背景三维点云数据是从传感器（如激光雷达或摄像头阵列）中采集的数据，用于表示三维空间中的物体和环境。这种数据在自动驾驶、机器人导航、建筑信息模

BFT白芙堂·2023-09-08 08:48

LLaMA(Open and Efficient Foundation Language Models )论文解读(二)

此篇博客主题:LLAMA模型数据、训练时长、功耗及碳排放量LLaMA:OpenandEfficientFoundationLanguageModelspaperhttps://arxiv.org/pdf/2302.13971v1.pdf1训练样本Overall,ourentiretrainingdatasetcontainsroughly1.4Ttokensaftertokenization.Fo

晚点吧·2023-09-07 20:51

阴影去除模型CRFormer-学习笔记

论文地址：https://arxiv.org/abs/2207.01600论文解读地址：Transformer去阴影！

欠我的都给我吐出来·2023-09-06 22:51

推荐频道

变化检测论文解读

DINO学习

《论文阅读》监督对抗性对比学习在对话中的情绪识别 ACL2023

--人行论文解读下篇

GPT系列论文解读：GPT-2

K-BERT论文解读

dm-vio-ros的安装（详细）

SentenceTransformer 之论文解读

Lenet5经典论文解读

KDD 2019论文解读：多分类下的模型可解释性

目标检测学习笔记3——Yolo1 Yolo论文解读

目标检测论文解读5——YOLO v1

【空间-光谱联合注意网络：多时相遥感图像】

2023 推荐系统论文整理

基于MATLAB的数字图像处理（三）——地物提取与变化检测

[博学谷学习记录] 超强总结，用心分享|Pyspark基础入门1

【论文解读】RALM：微信看一看中基于Attention机制的实时Look-alike推荐模型

Vision Transformer(ViT)论文解读与代码实践(Pytorch)

《Cascaded Pyramid Network for Multi-Person Pose Estimation》--旷世2017COCO keypoints冠军论文解读

数据库顶会 VLDB 2023 论文解读 - Krypton: 字节跳动实时服务分析 SQL 引擎设计

论文解读：多任务学习之PLE算法

【DDPM论文解读】Denoising Diffusion Probabilistic Models

多语言多模态（融合图像和文本）大模型-mPLUG-Owl论文解读

AI数字人：最强声音驱动面部表情模型VideoReTalking

车道线检测算法LaneNet + H-Net（论文解读）

【论文解读】——基于多尺度卷积网络的遥感目标检测研究（姚群力，胡显，雷宏）

InstructPix2Pix（CVPR2023）-图像编辑论文解读

【论文解读】Faster sorting algorithm

论文解读 | Transformer 原理深入浅出

【论文解读】Faster sorting algorithm

论文解读 | YOLO系列开山之作：统一的实时对象检测

论文解读 | 基于视觉的水果采摘机器人识别与定位方法研究进展

文章引言---森林干扰--isprs

Transformer Decoder详解

《论文阅读》常识感知的提示用于可控的同情对话生成 2023 AAAI

数据库顶会 VLDB 2023 论文解读：字节跳动如何解决超大规模流式任务运维难题

论文解读 | MVSNet：非结构化多视图立体的深度推理

Segment Anything Model(SAM)论文解读

【AI理论学习】语言模型Performer：一种基于Transformer架构的通用注意力框架

【论文解读】元学习：MAML

论文解读 | 用于3D对象检测的PV-RCNN网络原创

Side Window Filtering 论文解读和C++实现

Distortion-Free Wide-Angle Portraits on Camera Phones论文解读

【多模态论文解读】Align before Fuse: Vision and Language Representation Learning with Momentum Distillation

论文解读 | 基于中心的三维对象检测与跟踪

架构简析| 一种Generative Agents

TTS | VocGAN声码器训练自己的数据集

论文解读 | KPConv——点云上的可形变卷积网络

论文解读 | 点对照：3D点云理解无监督式预训练

LLaMA(Open and Efficient Foundation Language Models )论文解读(二)

阴影去除模型CRFormer-学习笔记