E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
图像去雾论文阅读
论文阅读
:Distributed Initialization for VVIRO with Position-Unknown UWB Network
前言DistributedInitializationforVisual-Inertial-RangingOdometrywithPosition-UnknownUWBNetwork这篇论文是发表在ICRA2023上的一篇文章,本文提出了一种基于位置未知UWB网络的一致性视觉惯性紧耦合优化测距算法(DC-VIRO)的分布式初始化方法。对于位置未知的UWB锚节点,我们通过求解一个机器人辅助的分布式定
独孤西
·
2023-12-01 11:25
论文阅读
论文阅读
论文阅读
:Estimating Odometry Scale and UWB Anchor Location Based on Semidefinite ProgrammingOptimization
前言2022年发表在RAL上的一篇论文,研究了里程计系统的未知度量尺度估计问题和超宽带(Ultra-wideband,UWB)锚点在环境中的三维定位问题。这篇文章的作者ThienHoangNguyen是UWB-VIO领域的主要研究人员,从最近一年的成果来看,他的研究方向从之前的注重UWB-VIO融合定位转变到现在的对UWB-VIO中更加精细问题的处理,以及UWB-VIO传感器融合在其他位姿估计场景
独孤西
·
2023-12-01 11:55
论文阅读
论文阅读
论文阅读
——SEEM
arxiv:分割模型向比较灵活的分割的趋势的转变:封闭到开放,通用到特定、one-shot到交互式。Fromclosed-settoopen-vocabularysegmentation,Fromgenerictoreferringsegmentation,Fromone-shottointeractivesegmentation。图片:图片提取的特征:初始化一个可学习的查询向量Qh:通过Text
じんじん
·
2023-12-01 00:37
论文
人工智能
论文阅读
《RelationNet2: Deep Comparison Columns for Few-Shot Learning》
十一月啦!时间真的很快从周四拖延一直到现在才写完的博希望接下来多努力一点多加油一点好运也多眷顾我一下!论文名称:《RelationNet2:DeepComparisonColumnsforFew-ShotLearning》论文地址:https://arxiv.org/pdf/1811.07100v3.pdf论文解读参考:https://blog.csdn.net/qq_36104364/artic
LiBiscuit
·
2023-11-30 11:48
【
论文阅读
】基于隐蔽带宽的汽车控制网络鲁棒认证(三)
文章目录第六章通过认证帧定时实现VulCAN的非once同步6.1问题陈述6.2方法概述6.3动机和缺点6.3.1认证帧定时隐蔽通信6.3.2VulCAN的梵蒂冈后端Nonce同步的应用6.4设计与实现6.4.1发送方6.4.2接收方6.4.3设计参数配置6.4.4实现6.5安全注意事项6.5.1系统模型6.5.2攻击者简介-级别1:网络攻击者6.5.3攻击者配置文件-级别2:软件攻击者6.5.4
人工智能有点
·
2023-11-30 10:51
CAN总线
汽车
网络
论文阅读
【
论文阅读
】【综述】Deep Learning for 3D Point Clouds: A Survey
文章目录Survey3DShapeClassificationProjectionbasedMulti-viewVoxelPointbasedPointwiseMLPnetworkConvolution-basedNetworksGraphbasedDataIndexingbased3DObjectDetectionRegionProposal-basedMethodsMulti-viewMeth
麒麒哈尔
·
2023-11-30 09:43
论文阅读
[
论文阅读
]CT3D——逐通道transformer改进3D目标检测
CT3D论文网址:CT3D论文代码:CT3D简读论文本篇论文提出了一个新的两阶段3D目标检测框架CT3D,主要的创新点和方法总结如下:创新点:(1)提出了一种通道注意力解码模块,可以进行全局和局部通道聚合,生成更有效的解码权重。(2)提出了建议到点嵌入模块,可以有效地将建议信息编码到每个原始点中。(3)整个框架端到端,可以非常方便的和任何高质量的建议生成网络结合,实现强大的建议优化。方法:(1)利
一朵小红花HH
·
2023-11-30 08:02
基于点云的三维目标检测
论文阅读
3d
transformer
人工智能
深度学习
cnn
[
论文阅读
]SA-SSD——基于点云的结构感知单阶段三维物体检测
SA-SSD基于点云的结构感知单级三维物体检测论文网址:SA-SSDSA-SSD的前向传播过程1.输入:原始点云数据,以及groundtruth框等标注信息2.数据预处理:将点云量化为稀疏张量表示,输入网络将点云量化为稀疏张量表示是使用的量化过程,SASSD的点云量化表示是:设置量化步长dx,dy,dz(如0.05m,0.05m,0.1m)对每个点(x,y,z),量化为(⌊x/dx⌋,⌊y/dy⌋
一朵小红花HH
·
2023-11-30 08:17
基于点云的三维目标检测
目标跟踪
人工智能
计算机视觉
论文阅读
3d
3D目标检测VoexlNet
3D目标检测VoexlNet模型构建博客参考:
论文阅读
:VoxelNet(3D-detection)+代码复现_手写代码3ddetection_Little_sky_jty的博客-CSDN博客Voxelnet
'十月'
·
2023-11-29 17:24
目标检测
3d
计算机视觉
Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D
论文阅读
论文链接Lift,Splat,Shoot:EncodingImagesfromArbitraryCameraRigsbyImplicitlyUnprojectingto3D0.Abstract提出了一种新的端到端架构,可以根据任意数量摄像机的图像数据直接提取场景的鸟瞰图表示方法的核心思想是将每个图像独立地“提升”(lift)到每个摄像头的特征金字塔中,然后将所有特征金字塔“喷洒”(splat)到一
KrMzyc
·
2023-11-29 07:25
3d
论文阅读
Cross-View Transformers for Real-Time Map-View Semantic Segmentation
论文阅读
论文链接Cross-ViewTransformersforReal-TimeMap-ViewSemanticSegmentation0.Abstract提出了Cross-ViewTransformers,一种基于注意力的高效模型,用于来自多个摄像机的地图视图语义分割使用相机感知的跨视图注意机制隐式学习从单个相机视图到规范地图视图表示的映射该架构由每个视图的卷积图像编码器和跨视图变换层组成,以推断地
KrMzyc
·
2023-11-29 07:55
论文阅读
BEVDepth: Acquisition of Reliable Depth for Multi-View 3D Object Detection
论文阅读
论文链接BEVDepth:AcquisitionofReliableDepthforMulti-View3DObjectDetection0.Abstract提出了一种新的3D物体检测器,具有值得信赖的深度估计,称为BEVDepth,用于基于相机的鸟瞰(BEV)3D物体检测BEVDepth通过利用显式深度监控来解决深度估计不足的问题,还引入了一个具有相机意识的深度估计模块,以促进深度预测能力设计了
KrMzyc
·
2023-11-29 07:21
论文阅读
U-Net代码复现--更新中
本文记录自己的学习过程,内容包括:代码解读:Pytorch-UNet深度学习编程基础:Pytorch-深度学习(新手友好)UNet论文解读:医学图像分割:U_Net
论文阅读
数据:https://hackernoon.com
北方骑马的萝卜
·
2023-11-29 06:42
深度学习
深度学习
U-Net
代码解读
python
pytorch
中英双语大模型ChatGLM
论文阅读
笔记
论文传送门:[1]GLM:GeneralLanguageModelPretrainingwithAutoregressiveBlankInfilling[2]Glm-130b:Anopenbilingualpre-trainedmodelGithub链接:THUDM/ChatGLM-6B目录笔记AbstractIntroductionThedesignchoicesofGLM-130B框架总结1.
Charlene Fung
·
2023-11-29 05:15
论文阅读
论文阅读
笔记
自然语言处理
语言模型
人工智能
nlp
【
论文阅读
笔记】Prompt-to-Prompt Image Editing with Cross-Attention Control
【
论文阅读
笔记】Prompt-to-PromptImageEditingwithCross-AttentionControl个人理解思考基本信息摘要背景挑战方法结果引言方法论结果讨论引用个人理解通过将caption
LuH1124
·
2023-11-29 05:15
论文阅读笔记
图像编辑
文生图
论文阅读
笔记
prompt
Aigc
文生图大模型
图像编辑
从2D到3D的目标检测综述
论文阅读
模块将分享点云处理,SLAM,三维视觉,高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享,欢迎各位加入我,我们一起每
点云PCL公众号博客
·
2023-11-28 20:55
算法
大数据
编程语言
计算机视觉
神经网络
论文阅读
笔记《GANomaly: Semi-Supervised Anomaly Detection via Adversarial Training》
核心思想 本文提出一种基于半监督GAN的异常检测算法,主要的创新点在于在自动编码器之后,又增加了一个编码器,构成了“编码-解码-编码”的结构,通过比较第二个编码器的输出和第一个编码器的输出之间的差别,来评估输入图像是否属于异常图像。网络的训练过程同样也引入了对抗训练的思想,即使用一个区分器对解码器输出的重构图像进行判断,是来自原始图像还是重构图像,整个网络的结构如下图所示 整个网络可以分为三个
深视
·
2023-11-28 18:15
论文阅读笔记
#
缺陷检测
深度学习
异常检测
论文阅读
| K-Radar: 4D Radar Object Detection for Autonomous Driving in Various Weather Conditions
论文简介本文介绍了K-Radar这一大型4D雷达张量(多普勒-距离-水平角-俯仰角)目标检测数据集。该数据集还包含高分辨率激光雷达点云、来自4个环视相机的RGB立体图像、RTK-GPS和自车的IMU数据。采集场景包括多种道路(城市、郊区、高速路等)、多个时段(白天、夜晚)、多种天气(晴、阴、雨、雾、雪、雨夹雪等),可以验证雷达对天气的鲁棒性。标注信息由激光雷达点云获得,可根据校准矩阵转换到雷达坐标
泡泡枪超人
·
2023-11-28 15:40
文献阅读
自动驾驶
[
论文阅读
笔记48]BLURB
一,题目Domain-SpecificLanguageModelPretrainingforBiomedicalNaturalLanguageProcessing作者:YUGU,ROBERTTINN,HAOCHENG,MICHAELLUCAS,NAOTOUSUYAMA,XIAODONGLIU,TRISTANNAUMANN,JIANFENGGAO,HOIFUNGPOON机构:MicrosoftRes
happyprince
·
2023-11-28 10:07
NER
NLP
机器学习
人工智能
深度学习
【
论文阅读
】TACAN:控制器局域网中通过隐蔽通道的发送器认证
文章目录摘要一、引言二、相关工作三、系统和对手模型3.1系统模型对手模型四、TACAN4.1TACAN架构4.2发送方认证协议4.3基于IAT的隐蔽通道4.4基于偏移的隐蔽通道(本节公式格式暂未整理)4.5基于LSB的隐蔽通道摘要如今,汽车系统与现代数字设备的互联为驾驶员提供了先进的用户体验。电子控制单元(ecu)在汽车信息物理系统(cps)中使用不安全的控制器局域网(CAN)总线执行大量操作。因
人工智能有点
·
2023-11-28 09:00
CAN总线
论文阅读
信息与通信
论文阅读
——DINOv
首先是关于给了提示然后做分割的一些方法的总结:左边一列是prompt类型,右边一列是使用各个类型的prompt的模型。这些模型有分为两大类:Generic和Refer,通用分割和参考分割。Genericseg是分割和提示语义概念一样的所有的物体,也就是提示是狮子,就把图片中所有狮子分割出来;Referseg是根据用户提示分割特定的物体,也就是提示是狗狗的一只耳朵,分割出来的也是狗狗的耳朵。可以看到
じんじん
·
2023-11-28 09:30
论文
深度学习
人工智能
【
论文阅读
笔记】StyleAvatar3D: Leveraging Image-Text Diffusion Models for High-Fidelity 3D Avatar Generation
【
论文阅读
笔记】StyleAvatar3D:LeveragingImage-TextDiffusionModelsforHigh-Fidelity3DAvatarGeneration
论文阅读
笔记论文信息摘要背景方法结果关键发现作者动机相关工作
LuH1124
·
2023-11-28 09:29
论文阅读笔记
文生图
论文阅读
笔记
AIGC
3Avatar
风格化
扩散模型
【
论文阅读
笔记】清单
我的论文清单记录即将阅读的论文清单,持续更新。未读论文以下是我计划阅读但尚未开始的论文列表:编号方向论文标题作者发表时间发表会议/期刊计划阅读日期code1NerfNeRFMeshing:DistillingNeuralRadianceFieldsintoGeometrically-Accurate3DMeshesGoogle2023/03arxiv2023/11暂无23dgsPhysGaussi
LuH1124
·
2023-11-28 09:59
论文阅读笔记
论文阅读
笔记
清单
大一统模型 Universal Instance Perception as Object Discovery and Retrieval
论文阅读
笔记
UniversalInstancePerceptionasObjectDiscoveryandRetrieval
论文阅读
笔记一、Abstract二、引言三、相关工作实例感知通过类别名进行检索通过语言表达式的检索通过指代标注的检索统一的视觉模型
乄洛尘
·
2023-11-28 08:26
新东西
论文阅读
笔记
图像处理
人工智能
transformer
【
论文阅读
】ActiveNeRF:通过不确定性估计候选新视图
【
论文阅读
】ActiveNeRF:LearningwheretoSeewithUncertaintyEstimationAbstract1Introduction3Background4NeRFwithUncertaintyEstimation5ActiveNeRF5.1PriorandPosteriorDistribution5.2AcquisitionFunction5.3Optimizati
WoooChi
·
2023-11-28 08:24
Reading
论文阅读
3d
计算机视觉
【
论文阅读
笔记】InstructDiffusion: A Generalist Modeling Interface for Vision Tasks
【
论文阅读
笔记】StyleAvatar3D:LeveragingImage-TextDiffusionModelsforHigh-Fidelity3DAvatarGeneration
论文阅读
笔记论文信息引言动机挑战方法结果关键发现相关工作
LuH1124
·
2023-11-28 08:50
论文阅读笔记
图像编辑
论文阅读
笔记
图像编辑
AIGC
通才模型
【网安AIGC专题】46篇前沿代码大模型论文、24篇
论文阅读
笔记汇总
本系列文章不仅涵盖了46篇关于前沿代码大模型的论文,还包含了24篇深度
论文阅读
笔记,全面覆盖了代码生成、漏洞检测、程序修复、生
是Yu欸
·
2023-11-28 03:53
科研笔记与实践
AIGC
论文阅读
笔记
网络安全
学习
AI编程
copilot
【
论文阅读
】Transformer——Attention Is All You Need
文章目录
论文阅读
模型架构代码合集utils.pymodel.pytrain.pytest.py
论文阅读
因为本人算是半个CV人,没有NLP的基础,这篇文章和代码也只是浅尝辄止,下载了大佬的代码跑了跑,看了看
每个人都是孙笑川
·
2023-11-28 01:10
教程
学习笔记
transformer
深度学习
自然语言处理
论文阅读
:Synthesizing Obama: Learning Lip Sync from Audio
文章目录音频到landmarks面部纹理合成候选帧选择加权中位数纹理的合成牙齿proxy(TeethProxy)音频到视频部分出现的术语:stockvideofootage:themanyhoursofonlineweeklyaddressvideosource:theinputaudiotracktargetvideo:stockvideoclipintowhichwecompositethes
live_for_myself
·
2023-11-28 01:31
论文阅读
深度学习
论文阅读
:Tooth model reconstruction based upon data fusion for orthodontic treatment simulation
【论文信息】ToothmodelreconstructionbasedupondatafusionfororthodontictreatmentsimulationComputersinBiologyandMedicine2014IF1.5二区【背景】回头看【方法】首先将石膏模型数字化,将上面每个牙齿分割下来。使用如下公式计算顶点的斜率。然后对斜率设定一个filter,就可以得到想要的区域。然后用
kczh
·
2023-11-28 01:59
论文阅读
:Crown Segmentation From Computed Tomography Images With Metal Artifacts
【论文信息】CrownSegmentationFromComputedTomographyImagesWithMetalArtifactsIEEESIGNALPROCESSINGLETTERS2016IF1.66三区同样出自ZeyangXia只手,深圳先进科学技术研究院【背景】当有金属植入物存在时,牙齿的轮廓不容易识别出来。牙冠的前表面会有凸出来的东西,而以往的方法都是默认没有这些存在的,所以该论
kczh
·
2023-11-28 01:59
论文阅读
:Three-dimensional reconstruction of teeth and jaws based on segmentation of CT images using wat
【论文信息】Three-dimensionalreconstructionofteethandjawsbasedonsegmentationofCTimagesusingwatershedtransformationDentomaxillofacialRadiology2015IF1.9【背景】现在CBCT的分辨率大约为0.1mm;MSCT的在0.2mm以上。而牙齿根部的牙周膜宽度小于0.1mm,
kczh
·
2023-11-28 01:29
论文阅读
:“Model-based teeth reconstruction”
文章目录AbstractIntroductionTeethPriorModelDataPreparationParametricTeethModelTeethFittingTeethBoundaryExtractionReferenceAbstract近年来,基于图像的人脸重建方法日趋成熟。这些方法可以捕捉整个面部或面部特定区域(如头发、眼睛或眼睑)的高精细静态和动态几何模型。遗憾的是,基于图像的
如松茂矣
·
2023-11-28 01:28
三维重建
论文阅读
牙齿重建
数字人
Re55:读论文 Entities as Experts: Sparse Memory Access with Entity Supervision
诸神缄默不语-个人CSDN博文目录诸神缄默不语的
论文阅读
笔记和分类论文名称:EntitiesasExperts:SparseMemoryAccesswithEntitySupervision模型名称:EntitiesasExperts
诸神缄默不语
·
2023-11-27 19:46
人工智能学习笔记
LLM
大规模预训练语言模型
实体识别
QA
【
论文阅读
】【ViT系列】Swin Transformer:使用移动窗口的多层视觉Transformer
论文:SwinTransformer:HierarchicalVisionTransformerusingShiftedWindows代码:https://github.com/microsoft/Swin-Transformer目录1主要贡献2原理2.1总体架构SwinTransformerblock2.2基于移动窗口的自注意力2.2.1不重叠窗口中的自注意力2.2.2连续block中的窗口划分
naive_learner
·
2023-11-27 13:32
论文阅读
transformer
深度学习
计算机视觉
论文阅读
17 | Cross-modality Person re-identification with Shared-Specific Feature Transfer
论文:Cross-modalityPersonre-identificationwithShared-SpecificFeatureTransfer(基于共享特征和具体特征转移的跨模态行人重识别)出处:CVPR2020文章目录1.motivation2.proposedmethod2.1Two-streamfeatureextractor2.2Shared-SpecificTransferNetw
Hygge MrYang
·
2023-11-27 12:25
跨模态行人重识别
网络
机器学习
论文阅读
:C2VIR-SLAM: Centralized Collaborative Visual-Inertial-Range SLAM
前言论文全程为C2VIR-SLAM:CentralizedCollaborativeVisual-Inertial-RangeSimultaneousLocalizationandMapping,是发表在MDPIdrones(二区,IF=4.8)上的一篇论文。这篇文章使用单目相机、惯性测量单元(IMU)和UWB设备作为每个智能体上的机载传感器,以构建准确高效的集中式协同SLAM系统,并设计了一个全
独孤西
·
2023-11-27 09:08
论文阅读
论文阅读
论文阅读
:“Appearance Capture and Modeling of Human Teeth”
文章目录AbstractIntroductionMethodOverviewTeethAppearanceModelEnamelDentinGingivaandoralcavityDataAcquisitionImagecaptureGeometrycaptureResultsReferencesAbstract如果要为电影,游戏或其他类型的项目创建在虚拟环境中显示的人类角色,我们通常需要获取人体
如松茂矣
·
2023-11-27 09:01
三维重建
论文阅读
正畸治疗
图形渲染
RT-DETR
论文阅读
笔记(包括YOLO版本训练和官方版本训练)
论文地址:RT-DETR论文地址代码地址:RT-DETR官方下载地址大家如果想看更详细训练、推理、部署、验证等教程可以看我的另一篇博客里面有更详细的介绍内容回顾:详解RT-DETR网络结构/数据集获取/环境搭建/训练/推理/验证/导出/部署目录一、介绍二、相关工作2.1、实时目标检测器的发展2.2、端到端目标检测器的流程2.3、强调多尺度特征在改进目标检测性能三、端到端检测器的速度3.1、分析NM
Snu77
·
2023-11-27 07:45
RT-DETR专栏
论文阅读
深度学习
人工智能
目标检测
transformer
python
计算机视觉
[
论文阅读
]CBAM——代码实现和讲解
CBAM论文网址:CBAM论文代码:CBAM本文提出了一种卷积块注意力模块(CBAM),它是卷积神经网络(CNN)的一种轻量级、高效的注意力模块。该模块沿着通道和空间两个独立维度依次推导注意力图,然后将这些注意力图与输入特征图相乘,进行自适应特征细化。CBAM可以无缝集成到任何CNN架构中,开销几乎可以忽略不计,并且可以与基本CNN一起进行端到端训练。作者通过在ImageNet-1K、MSCOCO
一朵小红花HH
·
2023-11-27 06:57
注意力机制
论文阅读
1024程序员节
深度学习
论文阅读
:《Revisiting Mid-Level Patterns for Distant-Domain Few-Shot Recognition》
本人终于来更新
论文阅读
啦!老样子还是小样本跨域论文这篇针对的是远域了。
LiBiscuit
·
2023-11-27 04:49
Transformer
论文阅读
(三):UNETR: Transformers for 3D Medical Image Segmentation
UNETR:Transformersfor3DMedicalImageSegmentation【Transformer用于3D医学图像分割】Abstract1Introduction2RelatedWork3Methodology3.1Architecture3.2LossFunction4Experiements4.1Datasets4.2ImplementationDetails4.3Quan
几夏经秋
·
2023-11-26 18:00
Transformer
in
Vision
计算机视觉
深度学习
神经网络
计算机视觉
图像处理
CADA-VAE
论文阅读
笔记
文中涉及的概念Few-shotlearning每个类只有很少的可见例子(一般小于10),训练一个模型对其分类。Zero-shotlearning现有一些可见的例子和一些不可见的例子,使用可见的例子训练模型能够对不可见的例子进行分类。Generalizedzero-shotlearning现有一些可见的例子和一些不可见的例子,使用可见的例子训练模型能够对所有的例子进行分类。Multi-modalal
Gary_Liu
·
2023-11-26 18:52
能对话的
论文阅读
器,hammerScholar
文|智商掉了一地hammerScholar新升级,用对话式读论文工具提升科研生产力~不得不说,自从AIGC这个概念出现以来,它极强的内容理解与生成能力也推动着各种生产力工具层出不穷,除了一些浏览器和代码插件以外,近期出现的很多阅读论文的辅助工具让本科研菜(懒)狗不禁狂喜,今天聊聊这个论文在线阅读器hammerPDF的使用,自从推出之后,我用它辅助读读论文、记记笔记,但近期的功能更新让阅读体验又上一
夕小瑶
·
2023-11-26 15:09
人工智能
【
论文阅读
】《隐写安全性增强与分布保持隐写研究》整理
绪论信息论下的隐写安全性:一个隐写系统,载体集合的分布为PcP_cPc,隐写后得到的载密集合分布为PsP_sPs,隐写安全性定义为两个分布之间的相对熵(KL散度)(难以计算,《隐写学技术与原理》上说用MMD最大平均偏差来替代P12)空域图像隐写非自适应隐写:LSB±1,改进思路提高嵌入效率,增加单位修改承载的消息容量,减少修改量,如MMD,ZZW编码。自适应隐写:有了STC编码后,定义合理的失真函
岁月漫长_
·
2023-11-26 15:00
图像隐写
论文阅读
计算机视觉
人工智能
论文阅读
——DDeP(cvpr2023)
分割标签耗时且贵,所以常常使用预训练提高分割模型标签有效性,反正就是,需要一个预训练分割模型。典型的分割模型encoder部分通过分类任务预训练,decoder部分参数随机初始化。作者认为这个方法次优,尤其标签比较少的情况。于是提出可以和监督学习encoder结合的基于去噪denoising的decoder预训练方法。当标签少的时候这个方法表现很好,超过监督学习。所以整个方法就是,encoder在
じんじん
·
2023-11-26 14:23
论文
人工智能
论文阅读
——Prophet(cvpr2023)
一、Framework这个模型分为两阶段:一是答案启发生成阶段(answerheuristicsgenerationstage),即在一个基于知识的VQA数据集上训练一个普通的VQA模型,产生两种类型的答案启发,答案候选列表和答案例子;二是启发增强提示阶段(heuristics-enhancedpromptingstage),即将答案启发、问题、描述融合为一个格式化的提示prompt,引导GPT-
じんじん
·
2023-11-26 14:53
论文
人工智能
论文阅读
——MCAN(cvpr2019)
补充一下MCAN-VQA:对图片的处理:首先输入图片到FasterR-CNN,会先设定一个判断是否检测到物体的阈值,这样动态的生成m∈[10,100]个目标,然后从检测到的对应的区域通过平均池化提取特征。第i个物体特征表示为:,所以一张图片就被表示为一个特征矩阵:。对问题的处理:首先分成词,最多分为14个词,然后用300-DGloVewordembeddings变成向量,然后过LSTM,使用LST
じんじん
·
2023-11-26 14:20
论文
人工智能
论文阅读
_生成式Agent
英文名称:GenerativeAgents:InteractiveSimulacraofHumanBehavior中文名称:生成代理:**人类行为的交互式模拟**文章:http://arxiv.org/abs/2304.03442代码:https://github.com/joonspk-research/generative_agents作者:JoonSungPark机构:斯坦福大学日期:202
xieyan0811
·
2023-11-26 06:20
论文阅读
论文阅读
(三十七)
论文阅读
| 目标检测之PAA
简介图1:论文原文论文聚焦的是在目标检测中的Anchor{\rmAnchor}Anchor分配问题,我们知道,Anchor{\rmAnchor}Anchor的分配策略是一个非常重要的环节,这往往决定了后续的边界框回归等操作,进而影响模型最终的性能。论文基于高斯混合模型,提出将Anchor{\rmAnchor}Anchor的得分视为一种概率。同时,Anchor{\rmAnchor}Anchor质量的
zhangts20
·
2023-11-26 05:48
论文阅读
深度学习
人工智能
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他