E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
知识蒸馏论文阅读
大模型GUI系列
论文阅读
DAY2续:《一个具备规划、长上下文理解和程序合成能力的真实世界Web代理》
摘要预训练的大语言模型(LLMs)近年来在自主网页自动化方面实现了更好的泛化能力和样本效率。然而,在真实世界的网站上,其性能仍然受到以下问题的影响:(1)开放领域的复杂性,(2)有限的上下文长度,(3)在HTML结构上的归纳偏差不足。我们提出WebAgent,一个由LLM驱动的智能代理,能够通过自我学习的方式,在真实网站上按照自然语言指令完成任务。WebAgent通过将指令提前规划,将其分解为子指
feifeikon
·
2025-01-21 15:19
论文阅读
论文阅读
笔记:AI+RPA
文章目录论文题目下载地址论文摘要论文题目Challengesandopportunities:ImplementingRPAandAIinfrauddetectioninthebankingsector下载地址点击这里下载论文摘要在银行业中,将机器人流程自动化(RPA)和人工智能(AI)集成用于欺诈检测是一项重大变革,既带来了挑战,也带来了机遇。随着金融机构面临日益复杂的欺诈企图,RPA和AI成为
几道之旅
·
2025-01-21 07:06
人工智能
YOLOv10改进,YOLOv10改进主干网络为GhostNetV3(2024年华为的轻量化架构,全网首发),助力涨点
我们发现,适当的重参数化和
知识蒸馏
设计对
挂科边缘
·
2025-01-20 23:19
YOLOv10改进
YOLO
计算机视觉
目标检测
人工智能
python
深度学习
论文阅读
:Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章,由google提出主要用来用轻量化的方法来实现高分辨率的图像生成,hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示,原始图像比如4k图像,首先分为两个主要模块:grid和guide。grid就是对应图上面的那一条特征提取网络,具体来说,原始图像经过下采样之后,默认256分
SetMaker
·
2025-01-20 22:47
论文阅读
知识蒸馏
和剪枝
知识蒸馏
(KnowledgeDistillation)和模型剪枝(ModelPruning)是两种常用的模型压缩和加速技术,它们被广泛用于提高模型的推理效率,尤其是在边缘设备和资源受限的环境中。
我叫罗泽南
·
2025-01-20 12:02
深度学习
剪枝
算法
机器学习
PenGymy
论文阅读
这里发现idea被人家先发了,没办法,资料收集的不够全面,现在来学习一下这个项目这篇论文的贡献如下:总的来说,他的主要工作是构建逼真的仿真环境,然后根据这个仿真环境生成真实的靶场,使得这个智能体能够在这个真实的环境去互动。下面来逐渐解析他的工作,我尽量详细一点1、背景和动机这种项目是在网络攻防中,攻防双方攻击者处于暗面,防御者处于明面,这时候受到攻击后应急处理多少会造成损失,那么要是可以提前预测攻
亚里士多没有德775
·
2025-01-18 05:50
论文阅读
《互联网时代教师自主成长的模式研究》
论文阅读
与思考2
2.第二部分教师自主成长的模式建构,实质上是对新网师底层逻辑的描述。你认为,新网师的培训模式与传统常见的培训模式有哪些区别?这些区别有什么意义或价值?读完第二部分后,你对新网师有哪些新的认识或理解?你认为新网师目前哪些方面做得好,哪些方面做得还不够?答:我认为新网师的培训模式与传统常见的培训模式有以下区别:(1)培训对象的参与动机不同。新网师学员的参与是自觉自愿、积极主动,而传统培训更多是被迫参与
宁超群
·
2024-09-14 03:01
【定位系列
论文阅读
】-Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition(一)
这里写目录标题概述研究内容Abstract第一段(介绍本文算法大致结构与优点)1.Introduction介绍第一段(介绍视觉位置识别的重要性)第二段(VPR的两种常见方法,本文方法结合了两种方法)第三段(本文贡献)第四段(为证明本文方法优越性,进行的测试以及比较)2.RelatedWork相关工作第一段(介绍早期与深度学习的全局图像描述符)第二段(介绍局部关键点描述符)第三段(局部描述符可以进一
醉酒柴柴
·
2024-09-11 21:32
论文阅读
学习
笔记
论文阅读
笔记(十九):YOLO9000: Better, Faster, Stronger
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
__Sunshine__
·
2024-09-11 21:59
笔记
YOLO9000
detection
classification
论文阅读
笔记: DINOv2: Learning Robust Visual Features without Supervision
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破,为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
小夏refresh
·
2024-09-11 20:50
论文
计算机视觉
深度学习
论文阅读
笔记
深度学习
计算机视觉
人工智能
周四 2020-01-09 08:00 - 24:30 多云 02h10m
二〇二〇年一月九日基本科研[1]:1.
论文阅读
论文--二小时十分2.论文实现实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:例会--英语能力
么得感情的日更机器
·
2024-09-08 23:58
【
论文阅读
】Mamba:选择状态空间模型的线性时间序列建模(二)
文章目录3.4一个简化的SSM结构3.5选择机制的性质3.5.1和门控机制的联系3.5.2选择机制的解释3.6额外的模型细节A讨论:选择机制C选择SSM的机制Mamba论文第一部分Mamba:选择状态空间模型的线性时间序列建模(一)3.4一个简化的SSM结构如同结构SSM,选择SSM是单独序列变换可以灵活地整合进神经网络。H3结构式最知名SSM结构地基础,其通常包括受线性注意力启发的和MLP交替地
syugyou
·
2024-09-08 15:52
Mamba状态空间模型
论文阅读
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning
论文阅读
笔记
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL,这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习(ML):集中收集数据->隐私保护问题privacy-preservingML(PPML)采
慘綠青年627
·
2024-09-06 10:44
论文阅读
笔记
深度学习
MixMAE(MixMIM):用于分层视觉变压器有效预训练的混合和掩码自编码器
论文阅读
论文:MixMAE(arxiv.org)代码:Sense-X/MixMIM:MixMIM:MixedandMaskedImageModelingforEfficientVisualRepresentationLearning(github.com)摘要:本文提出MixMAE(MixedandmaskAutoEncoder),这是一种简单而有效的预训练方法,适用于各种层次视觉变压器。现有的分层视觉变
皮卡丘ZPC
·
2024-09-06 08:04
扩散模型阅读
论文阅读
【
论文阅读
】LLM4CP: Adapting Large Language Models for Channel Prediction(2024)
摘要Channelprediction(信道预测)isaneffectiveapproach(有效方法)forreducingthefeedback(减少反馈)orestimationoverhead(估计开销)inmassivemulti-inputmulti-output(大规模多输入输出)(m-MIMO)systems.However,existingchannelpredictionmet
Bosenya12
·
2024-09-05 23:39
科研学习
论文阅读
语言模型
人工智能
信道预测
时间序列
【
论文阅读
】AugSteal: Advancing Model Steal With Data Augmentation in Active Learning Frameworks(2024)
摘要Withtheproliferationof(随着)machinelearningmodels(机器学习模型)indiverseapplications,theissueofmodelsecurity(模型的安全问题)hasincreasinglybecomeafocalpoint(日益成为人们关注的焦点).Modelstealattacks(模型窃取攻击)cancausesignifican
Bosenya12
·
2024-09-05 14:40
科研学习
模型窃取
论文阅读
模型窃取
模型提取
数据增强
主动学习
Bert系列:
论文阅读
Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline
一句话总结:提出LocalizedContrastiveEstimation(LCE),来优化检索排序。摘要预训练的深度语言模型(LM)在文本检索中表现出色。基于丰富的上下文匹配信息,深度LM微调重新排序器从候选集合中找出更为关联的内容。同时,深度lm也可以用来提高搜索索引,构建更好的召回。当前的reranker方法并不能完全探索到检索结果的效果。因此,本文提出了LocalizedContrast
凝眸伏笔
·
2024-09-04 01:37
nlp
论文阅读
bert
reranker
retrieval
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【
论文阅读
笔记】
此系列是本人阅读论文过程中的简单笔记,比较随意且具有严重的偏向性(偏向自己研究方向和感兴趣的),随缘分享,共同进步~论文主要内容:建立XL-MIMO模型,考虑NUSW信道和非平稳性;基于近场信道模型,分析性能(SNRscalinglaws,波束聚焦、速率、DoF)XL-MIMO设计问题:信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化:UPW➡NUSW空间平稳–>空间非平稳(可视区域
Cc小跟班
·
2024-09-03 08:22
【论文阅读】相关
论文阅读
笔记
论文阅读
:scMGCA----模型方法
Yu,Z.,Su,Y.,Lu,Y.etal.Topologicalidentificationandinterpretationforsingle-cellgeneregulationelucidationacrossmultipleplatformsusingscMGCA.NatCommun14,400(2023).https://doi.org/10.1038/s41467-023-36134
dundunmm
·
2024-09-03 07:46
论文阅读
论文阅读
人工智能
聚类
生物聚类
单细胞聚类
单细胞分析
论文阅读
:scHybridBERT
ZhangWei,WuChenjun,XingFeiyang,JiangMingfeng,ZhangYixuan,LiuQi,ShiZhuoxing,DaiQi,scHybridBERT:integratinggeneregulationandcellgraphforspatiotemporaldynamicsinsingle-cellclustering,BriefingsinBioinform
dundunmm
·
2024-09-03 07:42
论文阅读
机器学习
人工智能
神经网络
深度学习
单细胞基因测序
【
论文阅读
】Purloining Deep Learning Models Developed for an Ultrasound Scanner to a Competitor Machine
TheArtoftheSteal:PurloiningDeepLearningModelsDevelopedforanUltrasoundScannertoaCompetitorMachine(2024)摘要Atransferfunctionapproach(传递函数方法)hasrecentlyproveneffectiveforcalibratingdeeplearning(DL)algorit
Bosenya12
·
2024-09-02 06:40
科研学习
模型窃取
论文阅读
深度学习
人工智能
模型安全
《Motion Forecasting with Dual Consistency and Multi-Pseudo-Target Supervision》
论文阅读
之DCMS
目录摘要1简介2相关工作3.方法3.1结构3.2双重一致性约束3.3多伪目标监督3.4学习4实验4.1实验装置4.2实验结果4.3消融研究4.4泛化能力5限制6结论DCMS:具有双重一致性和多伪目标监督的运动预测香港科技大学暂无代码。摘要我们提出了一种具有双重一致性约束和多伪目标监督的运动预测新框架。运动预测任务通过结合过去的空间和时间信息来预测车辆的未来轨迹。DCMS的一个关键设计是提出双重一致
山水之间2018
·
2024-09-02 04:30
无人驾驶
Paper
Reading
大数据
轨迹预测
自动驾驶
人工智能
时序预测相关
论文阅读
笔记
笔记链接:【有道云笔记】读论文(记录)https://note.youdao.com/s/52ugLbot用于个人学习记录。
能力越小责任越小YA
·
2024-09-02 00:37
论文阅读
笔记
时序预测
Transformer
【
论文阅读
|cryoET】本周粗读汇总
论文1:CryoDRGN-ET:深度重建生成网络以可视化细胞内动态生物分子Abstract虽然冷冻电子断层扫描可以以分子分辨率揭示结构,但图像处理算法仍然是解决原位生物分子结构异质性的瓶颈。本文介绍CryoDRGN-ET用于cryoET断层图的异质重建。CryoDRGN-ET直接从子断层扫描倾斜系列图像中学习三维密度图的深度生成模型,并且可以捕获成分和构象不同的状态。通过原位恢复肺炎支原体核糖体中
吃吃今天努力学习了吗
·
2024-09-01 20:46
冷冻电镜三维重建
论文阅读
Your Diffusion Model is Secretly a Zero-Shot Classifier
论文阅读
笔记
YourDiffusionModelisSecretlyaZero-ShotClassifier
论文阅读
笔记这篇文章我感觉在智源大会上听到无数个大佬讨论,包括OpenAISora团队负责人,谢赛宁,好像还有杨植麟
Rising_Flashlight
·
2024-09-01 20:46
论文阅读
笔记
计算机视觉
【
论文阅读
】QUEEN: Query Unlearning against Model Extraction(2024)
摘要Modelextractionattacks(模型提取攻击)currentlyposeanon-negligiblethreat(不可忽视的威胁)tothesecurity(安全性)andprivacy(隐私性)ofdeeplearningmodels.Byqueryingthemodelwithasmalldataset(通过小数据集查询模型)andusingthequeryresultsa
Bosenya12
·
2024-09-01 20:45
科研学习
模型窃取
论文阅读
提取攻击
模型安全
【
论文阅读
33】Deep learning optoacoustic tomography with sparse data
Deeplearningoptoacoustictomographywithsparsedata论文题目:基于稀疏数据的深度学习光声断层扫描论文链接:Deeplearningoptoacoustictomographywithsparsedata|NatureMachineIntelligence代码链接:GitHub-ndavoudi/sparse_artefact_unet数据链接:Data发
弹伦琴的雷登
·
2024-09-01 18:29
【论文阅读系列】
人工智能
深度学习
论文阅读
图像处理
《BERT基础教程:Transformer大模型实战》读书笔记
知识蒸馏
(knowledged
johnny233
·
2024-08-31 19:39
读书笔记
人工智能
英伟达如何通过剪枝和蒸馏技术让Llama 3.1模型“瘦身“?
英伟达研究团队通过结构化权重剪枝和
知识蒸馏
技术,成功将Llama3.18B模型压缩为4B参数的小型语言模型,并取得了不俗的效果。让我们一起来深入探讨这项技术的原理和
蒜鸭
·
2024-08-30 19:28
人工智能
算法
机器学习
论文阅读
瞎记(四) Cascade R-CNN: Delving into High Quality Object Detection 2017
概述在物体检测中1,IOU阈值被用于判定正负样本。在低IOU阈值比如0.5的状态下训练模型经常产生噪音预测,然而检测效果会随着IOU增加而降低。两个主要因素:1.训练时的过拟合,正样本指数消失2.检测器最优IOU与输入假设的不匹配。一个单阶段的物体检测器CascadeR-CNN被提出用于解决这些问题。网络由一个检测序列组成,这些序列训练时会伴随IOU增长从而对FP样本更加有选择性地判别。检测器一个
码大哥
·
2024-08-30 15:58
深度学习
人工智能
【
论文阅读
】LLM4SGG: Large Language Models for Weakly Supervised Scene Graph Generation
【
论文阅读
】LLM4SGG:LargeLanguageModelsforWeaklySupervisedSceneGraphGenerationabstract由于全监督方法严重依赖昂贵标注,最近弱监督场景图生成
进击的乔洋
·
2024-08-28 19:03
论文阅读
语言模型
人工智能
计算机视觉
Code Llama: Open Foundation Models for Code
论文阅读
整体介绍CodeLlama发布了3款模型,包括基础模型、Python专有模型和指令跟随模型,参数量分别为7B、13B、34B和70B。这些模型在长达16ktokens的序列上训练。都是基于Llama2。作者针对infilling(FIM)、长上下文、指令专门做了微调long-contextfine-tuning(LCFT).codellama细节CodeLlama模型家族初始化:所有CodeLla
yang_daxia
·
2024-08-27 18:46
大模型
llama
codellama
【
论文阅读
】Model Stealing Attacks Against Inductive Graph Neural Networks(2021)
摘要Manyreal-worlddata(真实世界的数据)comeintheformofgraphs(以图片的形式).Graphneuralnetworks(GNNs图神经网络),anewfamilyofmachinelearning(ML)models,havebeenproposedtofullyleveragegraphdata(充分利用图数据)tobuildpowerfulapplicat
Bosenya12
·
2024-08-26 12:29
科研学习
模型窃取
论文阅读
图神经网络
模型窃取
【机器学习】机器学习与大模型在人工智能领域的融合应用与性能优化新探索
3BERTResNetTransformer机器学习与大模型的融合应用自然语言处理文本生成文本分类机器翻译图像识别自动驾驶医学影像分析语音识别智能助手语音转文字大模型性能优化的新探索模型压缩权重剪枝量化
知识蒸馏
分布式训练数据并行模型并行异步训练高效推理模型裁剪缓存机制专用硬件未来展望跨领域应用智能化系统人
E绵绵
·
2024-08-26 06:25
Everything
人工智能
机器学习
大模型
python
AIGC
应用
科技
VIT
论文阅读
: A Image is Worth 16x16 Words
简介在2024年,大家都知道了transformer的故事,但是在4年前,CNN和Transformer谁才是CV的未来,还没有那么确定。在简介部分,作者提到了一个令人失望的事实,在基于imagenet的实验中发现,transformer的表现差于同尺寸的ResNet。作者把原因归结到biastranslationequivarianceandlocality,这些CNN具有,但是transfor
Undefined游侠
·
2024-08-24 17:37
论文阅读
【
论文阅读
】GLiRA: Black-Box Membership Inference Attack via Knowledge Distillation
摘要While(虽然)DeepNeuralNetworks(DNNs)havedemonstratedremarkableperformanceintasksrelatedtoperception(感知)andcontrol(控制),therearestillseveralunresolvedconcerns(未解决的问题)regardingtheprivacyoftheirtrainingdat
Bosenya12
·
2024-08-24 16:35
模型窃取
科研学习
论文阅读
知识蒸馏
成员推理攻击
黑盒
【
论文阅读
】APMSA: Adversarial Perturbation Against Model Stealing Attacks(2023)
摘要TrainingaDeepLearning(DL)model(训练深度学习模型)requiresproprietarydata(专有数据)andcomputing-intensiveresources(计算密集型资源).Torecouptheirtrainingcosts(收回训练成本),amodelprovidercanmonetizeDLmodelsthroughMachineLearni
Bosenya12
·
2024-08-24 16:04
科研学习
模型窃取
论文阅读
模型窃取
防御
对抗性扰动
Conditional Flow Matching: Simulation-Free Dynamic Optimal Transport
论文阅读
笔记
ConditionalFlowMatching:Simulation-FreeDynamicOptimalTransport笔记发现问题连续正规化流(CNF)是一种有吸引力的生成式建模技术,但在基于模拟的最大似然训练中受到了限制。解决问题介绍一种新的条件流匹配(CFM),一种针对CNFs的免模拟训练目标。具有稳定的回归目标,用于扩散模型中的随机流,但享有确定性流模型的有效推断。与扩散模型和CNF目
猪猪想上树
·
2024-08-23 03:06
论文阅读
笔记
《
论文阅读
》EmpDG:多分辨率交互式移情对话生成 COLING 2020
《
论文阅读
》EmpDG:多分辨率交互式移情对话生成COLING2020前言简介模型架构共情生成器交互鉴别器损失函数前言亲身阅读感受分享,细节画图解释,再也不用担心看不懂论文啦~无抄袭,无复制,纯手工敲击键盘
365JHWZGo
·
2024-03-26 00:13
情感对话
论文阅读
共情回复
回复生成
对话系统
多分辨率
对抗学习
论文阅读
——SpectralGPT
SpectralGPT:SpectralFoundationModelSpectralGPT的通用RS基础模型,该模型专门用于使用新型3D生成预训练Transformer(GPT)处理光谱RS图像。重建损失由两个部分组成:令牌到令牌和频谱到频谱下游任务:
じんじん
·
2024-03-18 07:14
论文
计算机视觉
人工智能
论文阅读
:2020GhostNet华为轻量化网络
创新:(1)对卷积进行改进(2)加残差连接1、GhostModule1、利用1x1卷积获得输入特征的必要特征浓缩。利用1x1卷积对我们输入进来的特征图进行跨通道的特征提取,进行通道的压缩,获得一个特征浓缩。2、利用深度可分离卷积获得特征浓缩的相似特征图(Ghost)。在获得特征浓缩之后,利用深度可分离卷积进行逐层卷积,进行跨特征点的特征提取,获得额外的特征图,也就是Ghost。将这两个进行堆叠就是
A_my_*
·
2024-03-01 10:21
论文阅读
人工智能
计算机视觉
深度学习
Transformer视频理解学习的笔记
站视频理解沐神系列串讲视频上(24.2.26未看完,明天接着看)这里面更多论文见:https://github.com/mli/paper-reading/B站视频理解沐神系列串讲视频下(明天接着看)上面这张图中的
知识蒸馏
LinlyZhai
·
2024-02-28 14:26
transformer
学习
笔记
《
论文阅读
》e-CARE:探索可解释因果推理的新数据集 ACL2022
《
论文阅读
》e-CARE:探索可解释因果推理的新数据集ACL2022前言简介数据集优势数据集语料级别的统计数据集示例评分标准前言今天为大家带来的是《e-CARE:aNewDatasetforExploringExplainableCausalReasoning
365JHWZGo
·
2024-02-26 17:31
NLP
论文阅读
因果推理
eCARE
可解释性
数据集
论文阅读
笔记《SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning》
小样本学习&元学习经典论文整理||持续更新核心思想 本文提出一种基于最近邻方法的小样本学习算法(SimpleShot),作者指出目前大量的小样本学习算法都采用了元学习的方案,而作者却发现使用简单的特征提取器+最近邻分类器的方法就能实现非常优异的小样本分类效果。本文首先用特征提取网络fθf_{\theta}fθ+线性分类器在一个基础数据集上对网络进行训练,将训练得到的特征提取网络增加一个简单的特征
深视
·
2024-02-24 10:28
论文阅读笔记
#
小样本学习
深度学习
小样本学习
论文阅读
:四足机器人对抗运动先验学习稳健和敏捷的行走
论文:LearningRobustandAgileLeggedLocomotionUsingAdversarialMotionPriors进一步学习:AMP,baseline方法,TO摘要:介绍了一种新颖的系统,通过使用对抗性运动先验(AMP)使四足机器人在复杂地形上实现稳健和敏捷的行走。主要贡献包括为机器人生成AMP数据集,并提出一种教师-学生训练框架来学习稳健和敏捷的运动技能。该系统在现实世界
u小鬼
·
2024-02-20 21:53
论文阅读
论文阅读
强化学习
四足机器人
大模型量化技术原理-LLM.int8()、GPTQ
模型压缩主要分为如下几类:剪枝(Pruning)
知识蒸馏
(KnowledgeDistillation)量化之前也写过一些文章涉及大模型量化相关的内容。
吃果冻不吐果冻皮
·
2024-02-20 21:39
动手学大模型
人工智能
【
论文阅读
】【yolo系列】YOLO-Pose的
论文阅读
Abstract我们介绍YOLO-pose,一种无热图联合检测的新方法,基于流行的YOLO目标检测框架的图像二维多人姿态估计。【现有方法的问题】现有的基于热图的两阶段方法是次优的,因为它们不是端到端可训练的,训练依赖于surrogateL1loss,该损失不能直接优化评估指标–目标关键点相似度(OKS)。【ours优势:端到端训练,并优化OKS指标本身,无复杂的后处理】该模型学习了在一次前向传递中
magic_ll
·
2024-02-20 16:04
yolo系列
深度学习相关的论文阅读
论文阅读
YOLO
【
论文阅读
笔记】(2015 ICML)Unsupervised Learning of Video Representations using LSTMs
UnsupervisedLearningofVideoRepresentationsusingLSTMs(2015ICML)NitishSrivastava,ElmanMansimov,RuslanSalakhutdinovNotesContributionsOurmodelusesanencoderLSTMtomapaninputsequenceintoafixedlengthrepresent
小吴同学真棒
·
2024-02-20 08:26
学习
人工智能
LSTM
动作识别
无监督
自监督
self-supervised
知识蒸馏
实战代码教学一(原理部分)
一、
知识蒸馏
的来源
知识蒸馏
(KnowledgeDistillation)源自于一篇由Hinton等人于2015年提出的论文《DistillingtheKnowledgeinaNeuralNetwork》
业余小程序猿
·
2024-02-20 08:44
深度学习
机器学习
人工智能
知识蒸馏
知识蒸馏
实战代码教学二(代码实战部分)
一、上章原理回顾具体过程:(1)首先我们要先训练出较大模型既teacher模型。(在图中没有出现)(2)再对teacher模型进行蒸馏,此时我们已经有一个训练好的teacher模型,所以我们能很容易知道teacher模型输入特征x之后,预测出来的结果teacher_preds标签。(3)此时,求到老师预测结果之后,我们需要求解学生在训练过程中的每一次结果student_preds标签。(4)先求h
业余小程序猿
·
2024-02-20 08:35
深度学习
人工智能
机器学习
知识蒸馏
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他