E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语义分割论文笔记
景联文科技数据处理平台:支持高质量图像标注服务
分割标注:包括
语义分割
(同一类别的所有实例被视为整体)和实例分割(每
景联文科技
·
2025-02-17 00:35
人工智能
科技
计算机视觉
Python实战:解析labelme标注数据——如何将数据转换为COCO格式
在计算机视觉中,标注数据是非常重要的,而Labelme是一个简单易用的自由标注工具,被广泛应用于图像
语义分割
、目标检测、实例分割等领域,然而标注数据并不总是以我们需要的格式存在,因此需要进行适当的转换,
程序员杨弋
·
2025-02-16 11:24
Python全栈工程师学习指南
python
开发语言
【deepseek】
论文笔记
--DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
DeepSeek-R1论文解析1.论文基本信息标题:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning作者:DeepSeek-AI团队(联系邮箱:
[email protected]
)发表时间与出处:2024年,AIME2024(人工智能与数学教育国际会议)关键词:ReinforcementLe
大表哥汽车人
·
2025-02-15 02:40
人工智能
大语言模型学习笔记
论文阅读
人工智能
deepseek
计算机视觉四大任务模型汇总
计算机视觉中有四大核心任务:1-分类任务、2-目标检测任务、3-目标分割任务和4-关键点检测任务文章1:一文读懂计算机视觉4大任务文章2:图像的目标分割任务:
语义分割
和实例分割不同任务之间相关但不完全相同
Zero_one_ws
·
2025-02-14 05:59
《神经网络与深度学习》理论
计算机视觉
人工智能
深度学习
图像分类
图像目标检测
目标分割
关键点检测
论文笔记
《基于深度学习模型的药物-靶标结合亲和力预测》
基于深度学习模型的药物-靶标结合亲和力预测这是一篇二区的文章,算是一个综述,记录一下在阅读过程中遇到的问题。文章目录基于深度学习模型的药物-靶标结合亲和力预测前言一、蛋白质接触图谱二、为什么蛋白质图谱的准确性对DTA模型预测结果没有影响1.对这段话的解释2.关于Alphafold3三、随机配体与随机配体节点属性(配体一般指药物)1.什么是随机配体与配体节点属性四、关于深度学习模型对特征的自动学习过
I_dyllic
·
2025-02-14 03:57
深度学习
论文阅读
深度学习
人工智能
【
语义分割
专题文章】
本栏聚焦在
语义分割
的相关算法,专栏内文章的代码均已实现。
BoostingIsm
·
2025-02-13 22:59
Segmentation
python
深度学习
语义分割
实战:ResNet 与 ViT 结合的模型解析
1.引言
语义分割
是计算机视觉中的重要任务,其目标是将输入图像中的每个像素分类到特定的类别。
高山仰星
·
2025-02-12 15:06
深度学习
python工具方法 19
语义分割
结果转labelme标注(可用于大图裁剪)
将
语义分割
结果进行转换为labelme标注后,可用再次进行调整,然后重新生成标注数据。
万里鹏程转瞬至
·
2025-02-11 10:15
python工具方法
labelme
语义分割
opencv
png转labelme标注
使用U-Net处理Postdam数据集进行
语义分割
任务 如何从准备数据到训练和评估一个基于U-Net的模型。训练使用遥感影像分析研究
语义分割
数据集
使用U-Net处理Postdam数据集进行
语义分割
任务如何从准备数据到训练和评估一个基于U-Net的模型。
计算机C9硕士_算法工程师
·
2025-02-10 22:07
语义分割
unet
TC-LLaVA
论文笔记
RoPE介绍理解LLM位置编码:RoPE|LinsightMotivation在基于视频的multimodallargelanguagemodel中,更好地利用视频提供的时序信息。MethodTemporal-AwareDualRoPE之前的RoPE公式:A(qTm,kFnVz)=Re[qTmkFnVzei(P(Tm)−P(FnVz))θ]A_{(q_{T_m},k_{F_nV_z})}=Re[q
0yumiwawa0
·
2025-02-10 03:27
计算机视觉
论文阅读
CNN-day5-经典神经网络LeNets5
经典神经网络-LeNets51998年YannLeCun等提出的第一个用于手写数字识别问题并产生实际商业(邮政行业)价值的卷积神经网络参考:
论文笔记
:Gradient-BasedLearningAppliedtoDocumentRecognition-CSDN
谢眠
·
2025-02-10 03:54
深度学习
深度学习
计算机视觉
人工智能
[
论文笔记
] llama3.2 蒸馏
参考链接:LLaMA3.2技术报告:GitHub-meta-llama/llama-stack:ModelcomponentsoftheLlamaStackAPIs[2407.21783]TheLlama3HerdofModelshttps://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/HuggingFac
心心喵
·
2025-02-10 03:24
论文笔记
论文阅读
MobileNetV2: Inverted Residuals and Linear Bottlenecks
Link:https://arxiv.org/abs/1801.04381这篇文章是一篇关于MobileNetV2的学术论文,主要介绍了MobileNetV2的架构设计及其在图像分类、目标检测和
语义分割
任务中的应用
TAICHIFEI
·
2025-02-08 03:38
Paper
人工智能
计算机视觉
[
论文笔记
] Deepseek技术报告
1.总体概述背景与目标报告聚焦于利用强化学习(RL)提升大型语言模型(LLMs)的推理能力,旨在探索在不依赖大规模监督微调(SFT)的情况下,模型如何自我进化并形成强大的推理能力。介绍了两代模型:DeepSeek-R1-Zero(纯RL,无SFT冷启动数据)和DeepSeek-R1(在RL前加入少量冷启动数据和多阶段训练流程,提升可读性及推理表现)。核心思路直接在基础模型上应用大规模强化学习,利用
心心喵
·
2025-02-06 22:53
论文笔记
论文阅读
人工智能
基于深度学习的物体分割技术:从理论到实践
1.引言物体分割(ObjectSegmentation)是计算机视觉中的一项核心任务,其目标是将图像中的不同物体或区域分离出来,通常分为
语义分割
和实例分割两种类型。
人工智能_SYBH
·
2025-02-04 01:57
深度学习
人工智能
神经网络
机器学习
lstm
【
论文笔记
】基于图神经网络的多视角视觉重定位 GRNet CVPR 2020
论文笔记
GRNet:LearningMulti-viewCameraRelocalizationwithGraphNeuralNetworks驭势科技,北京大学机器感知重点实验室,北京长城航空测控技术研究所本文提出了一种使用多视角图像进行相机重定位的图神经网络。该网络可以使得不连续帧之间进行信息传递,相比于只能在相邻前后帧之间进行信息传递的序列输入和LTSM,其能捕获更多视角信息以进行重定位。因此LSTM
phy12321
·
2025-02-03 14:26
相机重定位
深度学习模型在汽车自动驾驶领域的应用
1.深度学习模型分类及应用场景1.1视觉感知模型CNN(卷积神经网络)应用:图像分类、物体检测(车辆、行人、交通标志)、
语义分割
(道路、车道线)。
eso1983
·
2025-02-01 12:37
深度学习
汽车
自动驾驶
论文笔记
(七十)DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(二)
DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning(二)文章概括摘要:2.方法2.3.DeepSeek-R1:冷启动强化学习2.3.1.冷启动2.3.2.面向推理的强化学习2.3.3.拒绝采样与监督微调2.3.4.面向所有场景的强化学习2.4.蒸馏:赋予小模型推理能力文章概括引用:@article{g
墨绿色的摆渡人
·
2025-01-31 07:01
文章
论文阅读
[论文总结] 深度学习在农业领域应用
论文笔记
14
当下,深度学习在农业领域的研究热度持续攀升,相关论文发表量呈现出迅猛增长的态势。但繁荣背后,质量却不尽人意。相当一部分论文内容空洞无物,缺乏能够落地转化的实际价值,“凑数”的痕迹十分明显。在农业信息化领域的顶刊《ComputersandElectronicsinAgriculture》中也大面积存在。众多论文在研究方法上存在严重缺陷,过于简单粗放。只是机械地把深度学习方法生硬地套用到特定农业问题中
落痕的寒假
·
2025-01-29 14:00
论文总结
深度学习
论文阅读
人工智能
[
论文笔记
] llama-factory 微调qwen2.5、llama3踩坑
一、bug1、pre-tokenize的时候,会OOM解决:在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams
心心喵
·
2025-01-28 20:14
论文笔记
深度学习
人工智能
使用小尺寸的图像进行逐像素
语义分割
训练,出现样本不均衡训练效果问题
在使用小尺寸图像进行逐像素
语义分割
训练时,确实可能出现样本不均衡问题,且这种问题可能比大尺寸图像更显著。1.小尺寸图像如何加剧样本不均衡?
司南锤
·
2025-01-28 08:18
深度学习
遥感
计算机视觉
人工智能
机器学习
参考图像分割Referring Image Segmentation(RIS)和开放词汇
语义分割
Open Vocabulary Semantic Segmentation
一、参考图像分割基本概念:ReferringImageSegmentation(RIS)是一种图像分割技术,旨在根据自然语言表达来标记图像或视频中表示对象实例的像素。也就是根据自然语言描述来实现图像分割。旨在根据自然语言表达来标记图像或视频中的特定区域。在给定描述区域的自然语言文本的情况下,RIS需要在图像中找到相应的区域。这个任务是众所周知的具有挑战性的视觉和语言任务之一。RIS需要收集目标区域
余弦的倒数
·
2025-01-28 02:59
深度学习
CV
笔记
计算机视觉
深度学习
[
论文笔记
] Megatron: mistral sliding window(ImportError: /workspace/venv/lib/python3.10/site-packag报错解决)
pyTorch—TransformerEngine1.2.1documentation论文:https://arxiv.org/pdf/2310.06825.pdftransformerengine的slidingwindow是用了flashatttention(新版本2以上,这里用的最新版本2.5.2)里对sliding_window的实现。所以不需要用transformerengine。直接用
心心喵
·
2025-01-28 00:46
论文笔记
论文阅读
【代码复现】ResUNet++进行
语义分割
(含图像切片预处理)
文章目录参考资料1.preprocess.py1.1.参数声明1.1.1.执行命令的形参1.1.2.代码中的参数声明2.train.py2.1.参数声明2.2.main函数(不包括训练阶段)2.2.1参数说明2.2.2.读取数据部分2.2.3.创建loaders2.3.训练阶段2.4.validation阶段3.其他相关代码3.1.model.py3.1.1.res_unet_plus.py3.1
Cpdr
·
2025-01-26 08:04
模型代码解读
深度学习
人工智能
深度ResUnet与ResUnet++:新一代的
语义分割
神器
深度ResUnet与ResUnet++:新一代的
语义分割
神器去发现同类优质开源项目:https://gitcode.com/在这个数据驱动的时代,深度学习模型在图像处理领域展现出了强大的潜力,尤其是在
语义分割
任务中
倪澄莹George
·
2025-01-26 07:29
NCNN推理
ncnn被广泛应用于移动端和嵌入式设备上的各种深度学习应用,包括但不限于:图像分类/目标检测/
语义分割
/人脸识别/图像生成与处理2.NCNN的CMakeLists.txt编写ncnn的头文件,链接文件,
呆呆珝
·
2025-01-25 05:07
推理框架
c++
人工智能
[
论文笔记
]自监督sketch-to-image生成:Self-Supervised Sketch-to-Image Synthesis
前言:2020年顶会同时出现了两篇很有意思的论文《Self-SupervisedSketch-to-ImageSynthesis》和《UnsupervisedSketch-to-PhotoSynthesis》,分别用自监督和无监督的方法做sketch-to-image生成,可以说是GANs在这一任务中表现的巅峰。目录主要贡献主要工作域转换模型TOMPS:边缘图、铅笔画图、草图sketch之间的区别
沉迷单车的追风少年
·
2025-01-23 23:10
深度学习-计算机视觉
sketch
深度学习
计算机视觉
【
论文笔记
】:DuBox: No-Prior Box Objection Detection via Residual Dual Scale Detectors
&Title:DuBox:No-PriorBoxObjectionDetectionviaResidualDualScaleDetectorsGithubaddrNone&Summary介绍了一种新的一阶段检测方法Dubox,它可以在没有先验框的情况下检测物体。设计的双尺度残差单元具有多尺度特性,使双尺度检测器不再独立运行。高层检测器学习低层检测器的残差。Dubox增强了启发式引导的能力,进一步使
Activewaste
·
2025-01-23 23:40
#
Anchor-free
#
特征层面
#
小目标检测
DuBox
anchor-free
【
论文笔记
】AutoML: A survey of the state-of-the-art(下篇)
目录4.ModelGeneration模型生成4.1SearchSpace搜索空间4.1.1Entire-structuredsearchspace基于整个架构的4.1.2Cell-basedsearchspace基于Cell的空间4.1.3Hierarchicalsearchspace层次化的空间4.1.3Morphism-basedsearchspace基于“态射”的空间4.2网络优化方法(搜
pip install USART
·
2025-01-22 18:31
学习笔记
论文阅读记录
论文阅读
算法
深度学习
论文笔记
U-Net: Convolutional Networks for Biomedical Image Segmentation
摘要:人们普遍认为,深度网络的成功训练需要数千个带注释的训练样本。在本文中,我们提出了一种网络和训练策略,该策略依赖于大量使用数据增强来更有效地使用可用的注释样本。该体系结构包括用于捕获上下文的收缩路径和用于实现精确定位的对称扩展路径。我们表明,这样的网络可以从很少的图像进行端到端训练,并且在ISBI挑战中优于先前的最佳方法(滑动窗口卷积网络),用于分割电子显微堆栈中的神经元结构。使用在透射光显微
城南皮卡丘
·
2025-01-22 10:24
#
深度学习
caffe
人工智能
AIGC视频生成模型:Meta的Emu Video模型
优质专栏回顾:机器学习笔记深度学习笔记多模态
论文笔记
AIGC—图像文章目录论文摘要引言相关工作文本到图像(T2I)扩散模型视频生成/预测文本到视频(T2V)生成分解生成方法预备知识EmuVideo生成步骤图
好评笔记
·
2025-01-22 10:21
#
Meta
AIGC-视频
AIGC
机器学习
人工智能
transformer
论文阅读
深度学习
面试
AIGC视频生成国产之光:ByteDance的PixelDance模型
优质专栏回顾:机器学习笔记深度学习笔记多模态
论文笔记
AIGC—图像文章目录论文摘要引言输入训练和推理时的数据处理总结相关工作视频生成长视频生成方法模型架构
好评笔记
·
2025-01-21 08:48
AIGC-视频
补档
AIGC
计算机视觉
人工智能
深度学习
机器学习
论文阅读
面试
【YOLOv8改进】 YOLOv8 更换骨干网络之 GhostNet :通过低成本操作获得更多特征 (
论文笔记
+引入代码)
YOLO目标检测创新改进与实战案例专栏专栏目录:YOLO有效改进系列及项目实战目录包含卷积,主干注意力,检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例介绍摘要在嵌入式设备上部署卷积神经网络(CNNs)由于有限的内存和计算资源而变得困难。特征图中的冗余是那些成功的CNNs的一个重要特性,但在神经架构设计中很少被研究。本文提出了一种新颖的Ghost模块,
YOLO大师
·
2025-01-20 22:47
YOLO
论文阅读
【论文投稿】探秘计算机视觉算法:开启智能视觉新时代
目录引言一、计算机视觉算法基石:图像基础与预处理二、特征提取:视觉信息的精华萃取三、目标检测:从图像中精准定位目标四、图像分类:识别图像所属类别五、
语义分割
:理解图像的像素级语义六、计算机视觉算法前沿趋势与挑战引言在当今数字化浪潮中
小周不想卷
·
2025-01-20 13:11
艾思科蓝学术会议投稿
计算机视觉
推荐3D UNet实现:深度学习3D体素数据
语义分割
的利器!
推荐3DUNet实现:深度学习3D体素数据
语义分割
的利器!
滑辰煦Marc
·
2025-01-18 14:57
个人学习笔记7-6:动手学深度学习pytorch版-李沐
#人工智能##深度学习##
语义分割
##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络(fullyconvolutionalnetwork,FCN)采用卷积神经网络实现了从图像像素到像素类别的变换
浪子L
·
2024-09-16 00:45
深度学习
深度学习
笔记
计算机视觉
python
人工智能
神经网络
pytorch
景联文科技:专业数据标注公司,推动AI技术革新
•图像标注:对象检测、
语义分割
、关键点标注、多边形标注等。•
景联文科技
·
2024-09-13 06:36
人工智能
Python(PyTorch和TensorFlow)图像分割卷积网络导图(生物医学)
要点
语义分割
图像三层分割椭圆图像脑肿瘤图像分割动物图像分割皮肤病变分割多模态医学图像多尺度特征生物医学肖像多类和医学分割通用图像分割模板腹部胰腺图像分割分类注意力网络病灶边界分割气胸图像分割Python
亚图跨际
·
2024-09-10 11:30
交叉知识
Python
生物医学
脑肿瘤图像
皮肤病变
多模态医学图像
多尺度特征生物医学
腹部胰腺图像
病灶边界
气胸图像
论文笔记
—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor
论文笔记
—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation
入门打工人
·
2024-09-10 03:09
笔记
slam
定位
算法
学习记录——
语义分割
和实例分割的标签结构
语义分割
:一张样本,生成一张掩码图像标签。灰度图像,背景亮度为0,每个目标根据分类赋予不同亮度——1,2,3......实现像素级的类别区分,但无法区分个体。
落叶击球
·
2024-09-06 08:05
学习笔记
学习
人工智能
[
论文笔记
]Circle Loss: A Unified Perspective of Pair Similarity Optimization
引言为了理解CoSENT的loss,今天来读一下CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization。为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。这篇论文从对深度特征学习的成对相似度优化角度出发,旨在最大化同类之间的相似度sps_ps
愤怒的可乐
·
2024-09-05 07:18
#
文本匹配[论文]
论文翻译/笔记
自然语言处理
论文阅读
人工智能
语义分割
训练精度计算
语义分割
训练的output结果一般是[batch_size,num_classes,width,height]这样的形式,而label的结果一般是[batch_size,width,height],类似如下形状
南太湖小蚂蚁
·
2024-09-05 06:10
人工智能
深度学习
人工智能
语义分割
笔记
在
语义分割
任务中,提升自制数据集上baselinemodel的平均交并比(mIoU)和平均精度(mAcc)的难度取决于多个因素。
Wils0nEdwards
·
2024-09-04 14:02
笔记
深度学习
计算机视觉
【
论文笔记
】Multi-Task Learning as a Bargaining Game
Abstract本文将多任务学习中的梯度组合步骤视为一种讨价还价式博弈(bargaininggame),通过游戏,各个任务协商出共识梯度更新方向。在一定条件下,这种问题具有唯一解(NashBargainingSolution),可以作为多任务学习中的一种原则方法。本文提出Nash-MTL,推导了其收敛性的理论保证。1Introduction大部分MTL优化算法遵循一个通用方案。计算所有任务的梯度g
xhyu61
·
2024-09-03 09:26
机器学习
学习笔记
论文笔记
论文阅读
人工智能
深度学习
[
论文笔记
] LLaVA
一、LLaVA论文中的主要工作和实验结果ExistingGap:之前的大部分工作都在做模态对齐,做图片的representationlearning,而没有针对ChatBot(多轮对话,指令理解)这种场景优化。Contribution:这篇工作已经在BLIP-2之后了,所以Image的理解能力不是LLaVA希望提升的重点,LLaVA是想提升多模态模型的Instruction-Followingab
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
[
论文笔记
] LLM模型剪枝
AttentionIsAllYouNeedButYouDon’tNeedAllOfItForInferenceofLargeLanguageModelsLLaMA2在剪枝时,跳过ffn和跳过fulllayer的效果差不多。相比跳过ffn/fulllayer,跳过attentionlayer的影响会更小。跳过attentionlayer:7B/13B从100%参数剪枝到66%,平均指标只下降1.7~
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
剪枝
算法
【
论文笔记
】Training language models to follow instructions with human feedback B部分
TraininglanguagemodelstofollowinstructionswithhumanfeedbackB部分回顾一下第一代GPT-1:设计思路是“海量无标记文本进行无监督预训练+少量有标签文本有监督微调”范式;模型架构是基于Transformer的叠加解码器(掩码自注意力机制、残差、Layernorm);下游各种具体任务的适应是通过在模型架构的输出后增加线性权重WyW_{y}Wy实
Ctrl+Alt+L
·
2024-09-02 01:12
大模型论文整理
论文笔记
论文阅读
语言模型
人工智能
自然语言处理
遥感影像-
语义分割
数据集:GID数据集详细介绍及训练样本处理流程
GID数据集:大规模高分卫星土地覆盖数据集原始数据集详情简介:GID是基于我国Gaofen-2卫星数据而构建的大规模高分辨率遥感图像土地覆盖数据集。GID数据集分为大规模分类集(GID-5)和精细土地覆盖集(GID-15)两个部分。大规模分类集(GID-5)包含建筑、农田、森林、草地和水域等5个土地覆盖类别,共计150景像素级标注的Gaofen-2卫星遥感图像。其中,训练集为120景图像,验证集为
GIS潮流
·
2024-09-01 18:33
计算机视觉
人工智能
机器学习
【
论文笔记
】:LAYN:用于小目标检测的轻量级多尺度注意力YOLOv8网络
背景针对嵌入式设备对目标检测算法的需求,大多数主流目标检测框架目前缺乏针对小目标的具体改进,然后提出的一种轻量级多尺度注意力YOLOv8小目标检测算法。小目标检测精度低的原因随着网络在训练过程中的加深,检测到的目标容易丢失边缘信息和灰度信息等。获得高级语义信息也较少,图像中可能存在一些噪声信息,误导训练网络学习不正确的特征。映射到原始图像的感受野的大小。当感受野相对较小时,空间结构特征保留较多,但
hhhhhhkkkyyy
·
2024-09-01 10:39
论文阅读
目标检测
YOLO
激光SLAM--(8) LeGO-LOAM
论文笔记
论文标题:LeGO-LOAM:LightweightandGround-OptimizedLidarOdometryandMappingonVariableTerrain应用在可变地形场景的轻量级的、并利用地面优化的LOAMABSTRACT轻量级的、基于地面优化的LOAM实时进行六自由度位姿估计,应用在地面的车辆上。强调应用在地面车辆上是因为在这里面要求雷达必须水平安装,而像LOAM和LIO-SA
lonely-stone
·
2024-08-30 20:29
slam
激光SLAM
论文阅读
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他