E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语义分割论文笔记
个人学习笔记7-6:动手学深度学习pytorch版-李沐
#人工智能##深度学习##
语义分割
##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络(fullyconvolutionalnetwork,FCN)采用卷积神经网络实现了从图像像素到像素类别的变换
浪子L
·
2024-09-16 00:45
深度学习
深度学习
笔记
计算机视觉
python
人工智能
神经网络
pytorch
景联文科技:专业数据标注公司,推动AI技术革新
•图像标注:对象检测、
语义分割
、关键点标注、多边形标注等。•
景联文科技
·
2024-09-13 06:36
人工智能
Python(PyTorch和TensorFlow)图像分割卷积网络导图(生物医学)
要点
语义分割
图像三层分割椭圆图像脑肿瘤图像分割动物图像分割皮肤病变分割多模态医学图像多尺度特征生物医学肖像多类和医学分割通用图像分割模板腹部胰腺图像分割分类注意力网络病灶边界分割气胸图像分割Python
亚图跨际
·
2024-09-10 11:30
交叉知识
Python
生物医学
脑肿瘤图像
皮肤病变
多模态医学图像
多尺度特征生物医学
腹部胰腺图像
病灶边界
气胸图像
论文笔记
—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor
论文笔记
—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation
入门打工人
·
2024-09-10 03:09
笔记
slam
定位
算法
学习记录——
语义分割
和实例分割的标签结构
语义分割
:一张样本,生成一张掩码图像标签。灰度图像,背景亮度为0,每个目标根据分类赋予不同亮度——1,2,3......实现像素级的类别区分,但无法区分个体。
落叶击球
·
2024-09-06 08:05
学习笔记
学习
人工智能
[
论文笔记
]Circle Loss: A Unified Perspective of Pair Similarity Optimization
引言为了理解CoSENT的loss,今天来读一下CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization。为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。这篇论文从对深度特征学习的成对相似度优化角度出发,旨在最大化同类之间的相似度sps_ps
愤怒的可乐
·
2024-09-05 07:18
#
文本匹配[论文]
论文翻译/笔记
自然语言处理
论文阅读
人工智能
语义分割
训练精度计算
语义分割
训练的output结果一般是[batch_size,num_classes,width,height]这样的形式,而label的结果一般是[batch_size,width,height],类似如下形状
南太湖小蚂蚁
·
2024-09-05 06:10
人工智能
深度学习
人工智能
语义分割
笔记
在
语义分割
任务中,提升自制数据集上baselinemodel的平均交并比(mIoU)和平均精度(mAcc)的难度取决于多个因素。
Wils0nEdwards
·
2024-09-04 14:02
笔记
深度学习
计算机视觉
【
论文笔记
】Multi-Task Learning as a Bargaining Game
Abstract本文将多任务学习中的梯度组合步骤视为一种讨价还价式博弈(bargaininggame),通过游戏,各个任务协商出共识梯度更新方向。在一定条件下,这种问题具有唯一解(NashBargainingSolution),可以作为多任务学习中的一种原则方法。本文提出Nash-MTL,推导了其收敛性的理论保证。1Introduction大部分MTL优化算法遵循一个通用方案。计算所有任务的梯度g
xhyu61
·
2024-09-03 09:26
机器学习
学习笔记
论文笔记
论文阅读
人工智能
深度学习
[
论文笔记
] LLaVA
一、LLaVA论文中的主要工作和实验结果ExistingGap:之前的大部分工作都在做模态对齐,做图片的representationlearning,而没有针对ChatBot(多轮对话,指令理解)这种场景优化。Contribution:这篇工作已经在BLIP-2之后了,所以Image的理解能力不是LLaVA希望提升的重点,LLaVA是想提升多模态模型的Instruction-Followingab
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
[
论文笔记
] LLM模型剪枝
AttentionIsAllYouNeedButYouDon’tNeedAllOfItForInferenceofLargeLanguageModelsLLaMA2在剪枝时,跳过ffn和跳过fulllayer的效果差不多。相比跳过ffn/fulllayer,跳过attentionlayer的影响会更小。跳过attentionlayer:7B/13B从100%参数剪枝到66%,平均指标只下降1.7~
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
剪枝
算法
【
论文笔记
】Training language models to follow instructions with human feedback B部分
TraininglanguagemodelstofollowinstructionswithhumanfeedbackB部分回顾一下第一代GPT-1:设计思路是“海量无标记文本进行无监督预训练+少量有标签文本有监督微调”范式;模型架构是基于Transformer的叠加解码器(掩码自注意力机制、残差、Layernorm);下游各种具体任务的适应是通过在模型架构的输出后增加线性权重WyW_{y}Wy实
Ctrl+Alt+L
·
2024-09-02 01:12
大模型论文整理
论文笔记
论文阅读
语言模型
人工智能
自然语言处理
遥感影像-
语义分割
数据集:GID数据集详细介绍及训练样本处理流程
GID数据集:大规模高分卫星土地覆盖数据集原始数据集详情简介:GID是基于我国Gaofen-2卫星数据而构建的大规模高分辨率遥感图像土地覆盖数据集。GID数据集分为大规模分类集(GID-5)和精细土地覆盖集(GID-15)两个部分。大规模分类集(GID-5)包含建筑、农田、森林、草地和水域等5个土地覆盖类别,共计150景像素级标注的Gaofen-2卫星遥感图像。其中,训练集为120景图像,验证集为
GIS潮流
·
2024-09-01 18:33
计算机视觉
人工智能
机器学习
【
论文笔记
】:LAYN:用于小目标检测的轻量级多尺度注意力YOLOv8网络
背景针对嵌入式设备对目标检测算法的需求,大多数主流目标检测框架目前缺乏针对小目标的具体改进,然后提出的一种轻量级多尺度注意力YOLOv8小目标检测算法。小目标检测精度低的原因随着网络在训练过程中的加深,检测到的目标容易丢失边缘信息和灰度信息等。获得高级语义信息也较少,图像中可能存在一些噪声信息,误导训练网络学习不正确的特征。映射到原始图像的感受野的大小。当感受野相对较小时,空间结构特征保留较多,但
hhhhhhkkkyyy
·
2024-09-01 10:39
论文阅读
目标检测
YOLO
激光SLAM--(8) LeGO-LOAM
论文笔记
论文标题:LeGO-LOAM:LightweightandGround-OptimizedLidarOdometryandMappingonVariableTerrain应用在可变地形场景的轻量级的、并利用地面优化的LOAMABSTRACT轻量级的、基于地面优化的LOAM实时进行六自由度位姿估计,应用在地面的车辆上。强调应用在地面车辆上是因为在这里面要求雷达必须水平安装,而像LOAM和LIO-SA
lonely-stone
·
2024-08-30 20:29
slam
激光SLAM
论文阅读
遥感影像-
语义分割
数据集:Vaihingen数据集详细介绍及训练样本处理流程
原始数据集详情Vaihingen是一个相对较小的村庄,有许多独立的建筑和小的多层建筑。KeyValue卫星类型未知覆盖区域一个相对较小的村庄,有许多独立的建筑和小的多层建筑-Vaihingen场景城市分辨率5cm数量38张单张尺寸6000*6000原始影像位深8位标签图片位深8位原始影像通道数三通道标签图片通道数三通道官网https://www.isprs.org/education/benchm
GIS潮流
·
2024-08-30 10:56
计算机视觉
论文浅尝 - AAAI2020 | 迈向建立多语言义元知识库:用于 BabelNet Synsets 义元预测...
论文笔记
整理:潘锐,天津大学硕士。来源:AAAI2020链接:https://arxiv.org/pdf/1912.01795.pdf摘要义原被定义为人类语言的最小语义单位。
开放知识图谱
·
2024-08-30 07:35
机器学习
人工智能
知识图谱
自然语言处理
深度学习
[
论文笔记
] LLM数据集——LongData-Corpus
https://huggingface.co/datasets/yuyijiong/LongData-Corpus1、hf的数据在开发机上要设置sshkey,然后cat复制之后在设置在hf上2、中文小说数据在云盘上清华大学云盘下载:#!/bin/bash#BaseURLbase_url="https://cloud.tsinghua.edu.cn/d/0670fcb14d294c97b5cf/fi
心心喵
·
2024-08-29 10:17
论文笔记
服务器
ubuntu
linux
[
论文笔记
] eval-big-refactor lm_eval 每两个任务使用一个gpu,并保证端口未被使用
1.5B在eval时候两个任务一个gpu是可以的。7B+在evalbelebele时会OOM,所以分配时脚本不同。eval_fast.py:importsubprocessimportargparseimportosimportsocket#参数列表task_name_list=["flores_mt_en_to_id","flores_mt_en_to_vi","flores_mt_en_to_
心心喵
·
2024-08-28 19:00
论文笔记
restful
后端
【
论文笔记
】Separating the “Chirp” from the “Chat”: Self-supervised Visual Grounding of Sound and Language
Abstract提出了DenseAV,一种新颖的双编码器接地架构,仅通过观看视频学习高分辨率、语义有意义和视听对齐的特征。在没有明确的本地化监督的情况下,DenseAV可以发现单词的"意义"和声音的"位置"。此外,它在没有监督的情况下自动发现并区分这两种类型的关联。DenseAV的定位能力源于一种新的多头特征聚合算子,该算子直接比较稠密的图像和音频表示进行对比学习。相比之下,许多其他学习"全局"音
xhyu61
·
2024-08-26 14:46
机器学习
学习笔记
论文笔记
论文阅读
Atrous Spatial Pyramid Pooling(ASPP)空洞空间卷积池化金字塔
文章目录概要整体架构流程演化过程与代码实现概要ASPP主要用于解决
语义分割
任务中的尺度问题。在
语义分割
任务中,需要将图像中的每个像素分类到不同的类别中,而不同物体和结构在图像中可能有不同的尺度。
m0_55576290
·
2024-08-26 06:22
深度学习
人工智能
图形学
论文笔记
文章目录PBD:XPBD:shapematchingPBD:【深入浅出NvidiaFleX】(1)PositionBasedDynamics最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码XPBD:基于XPBD的物理模拟一条龙:公式推导+代码+文字讲解(纯自制)【论文精读】XPBD基于位置的动力学XPBD论文解读(
Jozky86
·
2024-08-25 18:10
图形学
图形学
笔记
深度学习,创新点,模型改进
机器学习,目标检测,目标识别,
语义分割
,GAN,CNN等(只要是深度学习均可)编程语言限于Python,pytorch欢迎大家咨询~
揽星河@
·
2024-08-23 21:00
计算机视觉
机器学习
深度学习
python
人工智能
【深度学习】COCO API源码解读
COCOAPI从C、cython,到PythonAPI:实现
语义分割
标注mask的解析,从具体实现cocoapi/common/maskApi.hcocoapi/common/maskApi.c到Cython
CS_Zero
·
2024-03-13 23:50
深度学习
人工智能
【视觉三维重建】【
论文笔记
】Deblurring 3D Gaussian Splatting
去模糊的3D高斯泼溅,看Demo比3D高斯更加精细,对场景物体细节的还原度更高,[官网](https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/)背景技术Volumetricrendering-basednerualfields:NeRF.Rasterizationrendering:3D-GS.Rasterization比vol
CS_Zero
·
2024-03-12 05:51
论文阅读
2020-04-04
语义分割
是高分辨率航空图像分析中广泛使用的一种基本方法。然而,高分辨率航空影像地物具有尺度不一致的特征,这一特征往往会导致预测结果的不确定性。为了解决这个问题,我们提出了一个新的尺度感知模块(SAM
奋斗中的小强
·
2024-03-11 19:36
[
论文笔记
] Transformer-XL
这篇论文提出的Transformer-XL主要是针对Transformer在解决长依赖问题中受到固定长度上下文的限制,如Bert采用的Transformer最大上下文为512(其中是因为计算资源的限制,不是因为位置编码,因为使用的是绝对位置编码正余弦编码)。Transformer-XL能学习超过固定长度的依赖性,而不破坏时间一致性。它由段级递归机制和一种新的位置编码方案组成。该方法不仅能够捕获长期
心心喵
·
2024-03-08 14:09
论文笔记
transformer
深度学习
人工智能
SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning
论文笔记
前言目前大多数小样本学习器首先使用一个卷积网络提取图像特征,然后将元学习方法与最近邻分类器结合起来,以进行图像识别。本文探讨了这样一种可能性,即在不使用元学习方法,而仅使用最近邻分类器的情况下,能否很好地处理小样本学习问题。本文发现,对图像特征进行简单的特征转换,然后再进行最近邻分类,也可以产生很好的小样本学习结果。比如,使用DenseNet特征的最近邻分类器,在结合均值相减(meansubtra
头柱碳只狼
·
2024-02-24 10:28
小样本学习
多模态相关
论文笔记
(cilp)LearningTransferableVisualModelsFromNaturalLanguageSupervision从自然语言监督中学习可迁移的视觉模型openAI2021年2月48页PDFCODECLIP(ContrastiveLanguage-ImagePre-Training)对比语言图像预训练模型引言它比ImageNet模型效果更好,计算效率更高。尤其是zero-sho
靖待
·
2024-02-24 10:27
大模型
人工智能
论文阅读
【
论文笔记
· PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting
Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting摘要本文提出Lag-Llama,在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取得较好效果。模型使用平滑破坏幂律(smoothlybrokenpower-laws)。介绍目前任务主要集中于在相同域的数据上训练模型。当前已有的大规模通用模型在大规模不同数
lokol.
·
2024-02-20 08:49
论文笔记
论文阅读
llama
【
论文笔记
】Unsupervised Learning of Video Representations using LSTMs
摘要翻译我们使用长短时记忆(LongShortTermMemory,LSTM)网络来学习视频序列的表征。我们的模型使用LSTM编码器将输入序列映射到一个固定长度的表征向量。之后我们用一个或多个LSTM解码器解码这个表征向量来实现不同的任务,比如重建输入序列、预测未来序列。我们对两种输入序列——原始的图像小块和预训练卷积网络提取的高层表征向量——都做了实验。我们探索不同的设计选择,例如解码器的LST
奶茶不加糖え
·
2024-02-20 08:25
lstm
深度学习
自然语言处理
计算机设计大赛 深度学习人体
语义分割
在弹幕防遮挡上的实现 - python
文章目录1前言1课题背景2技术原理和方法2.1基本原理2.2技术选型和方法3实例分割4实现效果5最后1前言优质竞赛项目系列,今天要分享的是深度学习人体
语义分割
在弹幕防遮挡上的应用该项目较为新颖,适合作为竞赛课题方向
iuerfee
·
2024-02-20 07:03
python
MOSSE算法
论文笔记
以及代码解释
论文《VisualObjectTrackingusingAdaptiveCorrelationFilters》代码github1.论文idea提出以滤波器求相关的形式,找到最大响应处的位置,也就是我们所跟踪的目标的中心,进而不断的更新跟踪目标框和滤波器。2.跟踪策略如图,根据初始帧圈出的目标框训练滤波器,最大响应处为目标框的中心点,当移动到下一帧时,根据滤波器求相关的算法获得最大响应值,进而得出下
five days
·
2024-02-20 06:51
计算机视觉
深度学习
机器学习
Attention Is All Your Need
论文笔记
论文解决了什么问题?提出了一个新的简单网络架构——transformer,仅仅是基于注意力机制,完全免去递推和卷积,使得神经网络训练地速度极大地提高。Weproposeanewsimplenetworkarchitecture,theTransformer,basedsolelyonattentionmechanisms,dispensingwithrecurrenceandconvolution
xiaoyan_lu
·
2024-02-19 13:09
论文笔记
论文阅读
[机器学习]详解transformer---小白篇
全面击败了当时的SOTA,现阶段,Transformer在cv领域也是全面开花,基于transformer的目标识别,
语义分割
等算法也是经常屠榜。论文:[1706.03762
是安澜啊
·
2024-02-15 08:11
深度学习
神经网络
【深度学习每日小知识】全景分割
与传统的
语义分割
相比,它是一种更全面的图像分割方法,传统的
语义分割
仅将图像划分为类别,而不考虑对象的部分。全景分割算法将
语义分割
和实例分割相结合,可以区分对象的一般类及其组成部分或实例。
jcfszxc
·
2024-02-14 11:47
深度学习术语表专栏
深度学习
人工智能
语义分割
技术的简单总结
几天前在公众号计算机视觉life上投稿了一篇文章,今天特此在这里mark一下,文章链接如下。https://mp.weixin.qq.com/s?__biz=MzIxOTczOTM4NA==&mid=2247488089&idx=1&sn=a7b18c154a84864521f2eb116585aee9&chksm=97d7f7cea0a07ed8da2a881efffc9a690c695b265
孤独患者_d589
·
2024-02-13 20:32
前向传播网络实现(类与函数)——TensorFlow2.4
文章目录前言一、基于类的前向传播二、基于函数的前向传播总结前言最近开始着手
语义分割
方面的内容,由于刚开始入门深度学习,看了一下deeplab的源码,里面所有网络结构基本上都是由类进行定义的(目的是为了方便复用
SatVision炼金士
·
2024-02-12 11:21
网络
深度学习
keras
论文笔记
:相似感知的多模态假新闻检测
整理了RecSys2020ProgressiveLayeredExtraction:ANovelMulti-TaskLearningModelforPersonalizedRecommendations)论文的阅读笔记背景模型实验论文地址:SAFE背景 在此之前,对利用新闻文章中文本信息和视觉信息之间的关系(相似性)的关注较少。这种相似性有助于识别虚假新闻,例如,虚假新闻也许会试图使用不相关的图
图学习的小张
·
2024-02-11 19:11
论文笔记
论文阅读
python
半监督
语义分割
论文学习记录
在
语义分割
中,在输入中,我们没有观察到低密度区域
西瓜真的很皮啊
·
2024-02-11 14:19
半监督语义分割
深度学习
机器学习
人工智能
2023最新半监督
语义分割
综述 | 技术总结与展望!
作者|派派星编辑|CVHub点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【
语义分割
】技术交流群后台回复【分割综述】获取
语义分割
、实例分割、全景分割、弱监督分割等超全学习资料
自动驾驶之心
·
2024-02-11 14:49
计算机视觉
人工智能
深度学习
python
机器学习
[论文总结] 深度学习在农业领域应用
论文笔记
12
文章目录1.3D-ZeF:A3DZebrafishTrackingBenchmarkDataset(CVPR,2020)摘要背景相关研究所提出的数据集方法和结果个人总结2.Automatedflowerclassificationoveralargenumberofclasses(ComputerVision,Graphics&ImageProcessing,2008)摘要背景分割与分类数据集和实
落痕的寒假
·
2024-02-11 12:26
论文总结
深度学习
论文阅读
人工智能
论文笔记
之LINE:Large-scale Information Network Embedding
原文:LINE:Large-scaleInformationNetworkEmbedding本文提出一种新的networkembeddingmodel:LINE.能够处理大规模的各式各样的网络,比如:有向图、无向图、有权重图、无权重图.文中指出对于networkembedding问题,需要保留localstructure和globalstructure,分别对应first-orderproximi
小弦弦喵喵喵
·
2024-02-11 03:13
语义分割
任务的准确率计算:基于PyTorch实现
语义分割
任务的准确率计算:基于PyTorch实现文章目录引言
语义分割
任务概述准确率的定义与计算方法实践应用与优化策略准确率的局限性分析结尾引言随着深度学习技术的飞速发展,
语义分割
任务作为计算机视觉领域的一个重要分支
高斯小哥
·
2024-02-10 21:34
PyTorch
pytorch
人工智能
python
pycharm
深度学习
机器学习
【深度学习】: 脑部MRI图像分割
实验满分),只展示主要任务实验结果,如果需要详细的实验报告或者代码可以私聊博主,接实验技术指导1对1有任何疑问或者问题,也欢迎私信博主,大家可以相互讨论交流哟~~案例4:脑部MRI图像分割相关知识点:
语义分割
X.AI666
·
2024-02-10 11:05
深度学习
深度学习
人工智能
打败一切NeRF! 3D Gaussian Splatting 的 简单入门知识
新手的
论文笔记
3DGaussianSplatting的笔记introductionRelatedwork预备知识Gaussiansplatting3D高斯泼溅原理Overview3DGaussianSplatting
Ci_ci 17
·
2024-02-10 10:48
3d
python
kaggle实战
语义分割
-Car segmentation(附源码)
目录前言项目介绍数据集处理数据集加载定义网络训练网络验证网络前言本篇文章会讲解使用pytorch完成另外一个计算机视觉的基本任务-
语义分割
。
橘柚jvyou
·
2024-02-10 09:07
python
人工智能
计算机视觉
深度学习
pytorch
《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》
论文笔记
参考代码:无1.概述导读:在检测任务中一般会引入FPN增强在不同尺度下网络的检测性能,但是只通过top-down的FPN网络是很难去重建由于特征图的漂移(水平或是垂直方向运动)在经过pooling操作(pooling不具有平移不变性)带来结果相差很大的问题(特别针对小目标),而且FPN带来的性能提升会在使用较多卷积层之后逐渐被稀释(卷积的平移不变形),进而会导致一些小目标定位性能降低。对此可以通过
m_buddy
·
2024-02-09 18:37
#
General
Object
Detection
Bi-Fusion
【大厂AI课学习笔记】【1.5 AI技术领域】(7)图像分割
图像分割分为三类:
语义分割
。预测出输入熟悉的每个像素点属于哪一类的标签实例分割。在
语义分割
的基础上,还要区分出同一类的不同个体全景分割。在实例分
giszz
·
2024-02-09 10:44
学习笔记
人工智能
学习
笔记
论文笔记
-Generative Adversarial Nets
论文链接:https://papers.nips.cc/paper/2014/file/5ca3e9b122f61f8f06494c97b1afccf3-Paper.pdf论文解读:https://www.bilibili.com/video/BV1rb4y187vD?share_source=copy_web一句话总结:提出了生成模型框架GAN,包括一个生成模型G和一个判别模型D,用有监督的损失
升不上三段的大鱼
·
2024-02-09 05:49
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他