E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
模糊测试论文阅读
论文阅读
【CVPR-2022】3D Shape Variational Autoencoder Latent Disentanglement via Mini-Batch Feature Swappi
3DShapeVariationalAutoencoderLatentDisentanglementviaMini-BatchFeatureSwappingforBodiesandFaces通过小批量特征互换实现身体和脸部的三维形状变异自动编码器潜移默化studyai.com搜索论文:3DShapeVariationalAutoencoderLatentDisentanglementviaMini
智尊宝人工智能社区
·
2025-01-27 06:19
人工智能
计算机视觉
论文阅读
笔记(9)——《A Practical Survey on Faster and Lighter Transformers》
1Abstract2Introductionrecurrentneuralnetworks(RNNs)longshort-termmemory(LSTM)networksequencetosequenceframeworkinter-attentionrelativeeffectivecontextlength(RECL)Transformer3TransformerA.EncoderB.Deco
StriveQueen
·
2025-01-26 08:32
自然语言处理
机器学习
论文阅读笔记
算法
神经网络
机器学习
Transformer
【OTFS与信号处理:
论文阅读
1】:考虑分数多普勒的OTFS系统有效信道估计(24.01.16更新)
【OTFS与信号处理:
论文阅读
1】EfficientChannelEstimationforOTFSSystemsinthePresenceofFractionalDoppler前言一、摘要及背景摘要分数多普勒的引入估计分数多普勒的意义研究现状二
Cuby!
·
2025-01-25 20:59
OTFS论文学习
信号处理
论文阅读
人工智能
论文阅读
:DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection(Deepfake模型快速调参)
一、论文信息论文名称:DeepFake-Adapter:Dual-LevelAdapterforDeepFakeDetection作者团队:项目主页:https://github.com/rshaojimmy/DeepFake-Adapter(代码暂未开源)二、动机与创新动机:目前的deepfake检测模型泛化能力差,将其归因于过拟合于低级的伪造模式,现有的deepfake检测方法仅关注低级别的伪
海拉鲁的小厨娘
·
2025-01-25 16:52
读论文
论文阅读
大模型GUI系列
论文阅读
DAY4:《PREDICT: Multi-Agent-based Debate Simulation for Generalized Hate Speech Detecti》
摘要虽然已经提出了一些公共基准用于训练仇恨言论检测模型,但这些基准之间的标注标准差异为模型的泛化学习带来了挑战,限制了其适用性。先前的研究提出了通过数据整合或扩充来泛化模型的方法,但在克服数据集之间的标注标准差异方面仍然存在局限性。为了解决这些挑战,我们提出了PREDICT,一种基于多代理(multi-agent)概念的仇恨言论检测新框架。PREDICT包括两个阶段:(1)PRE(基于视角的推理)
feifeikon
·
2025-01-25 15:50
论文阅读
图神经网络系列
论文阅读
DAY1:《Predicting Tweet Engagement with Graph Neural Networks》
摘要翻译:社交网络是全球范围内分享内容的重要在线渠道之一。在这种背景下,预测一篇帖子在互动方面是否会产生影响,对于推动这些媒体的盈利利用至关重要。在现有研究中,许多方法通过利用帖子的直接特征来解决这一问题,这些特征通常与文本内容以及发布该帖子的用户相关。在本文中,我们认为互动的增加还与另一个关键因素相关,即社交媒体用户发布的帖子之间的语义关联。因此,我们提出了一种基于图神经网络(GraphNeur
feifeikon
·
2025-01-25 15:18
神经网络
论文阅读
人工智能
大模型GUI系列
论文阅读
DAY2续2:《使用指令微调基础模型的多模态网页导航》
摘要自主网页导航的进展一直受到以下因素的阻碍:依赖于数十亿次的探索性交互(通常采用在线强化学习),依赖于特定领域的模型设计,难以利用丰富的跨领域数据进行泛化。在本研究中,我们探讨了基于视觉-语言基础模型的数据驱动离线训练方法,以改进网页代理的性能。我们提出了一种名为WebGUM的指令跟随多模态代理,该代理能够同时观察网页截图和HTML页面,并输出网页导航操作,例如点击和输入文本等。WebGUM通过
feifeikon
·
2025-01-24 02:33
论文阅读
大模型GUI系列
论文阅读
DAY3:《GPT-4V(ision) is a Generalist Web Agent, if Grounded》
摘要近年来,大型多模态模型(LMMs)的发展,特别是GPT-4V(ision)和Gemini,迅速扩展了多模态模型的能力边界,不再局限于传统任务如图像描述和视觉问答。在本研究中,我们探讨了LMMs(如GPT-4V)作为通用网页代理的潜力,这类代理能够根据自然语言指令完成任意网站上的任务。我们提出了SEEACT,这是一种通用网页代理,利用LMMs的视觉理解能力,实现网页上的操作。我们在最新的MIND
feifeikon
·
2025-01-24 01:58
论文阅读
《
论文阅读
》 用于产生移情反应的迭代联想记忆模型 ACL2024
《
论文阅读
》用于产生移情反应的迭代联想记忆模型ACL2024前言简介任务定义模型架构EncodingDialogueInformationCapturingAssociatedInformationPredictingEmotionandGeneratingResponse
365JHWZGo
·
2025-01-22 17:28
情感对话
论文阅读
回复生成
ACL
2024
共情回复
empathetic
论文阅读
--Qwen2&2.5技术报告
Qwen21引言所有模型都是在超过7trilliontoken(7万亿)的高质量、大规模数据集上预训练的2Tokenizer&Model2.1Tokenizer沿用Qwen(Bai等人,2023a)的做法,我们采用了基于字节级字节对编码的相同Tokenizer所有大小的模型都采用一个共有词汇表,包含151,643个常规词元和3个控制词元2.2模型架构基于Transformer架构的大型语言模型,具
__如果
·
2025-01-22 17:55
论文阅读
qwen
大模型GUI系列
论文阅读
DAY3续4:《TREE SEARCH FOR LANGUAGE MODEL AGENTS》
摘要自主代理由语言模型(LMs)驱动,已在执行诸如网页自动化等决策任务方面展示出良好前景。然而,语言模型的一个主要局限在于:它们主要针对自然语言理解和生成进行了优化,在解决现实世界的计算机任务时,难以应对多步推理、规划以及环境反馈的利用。为了解决这一问题,我们提出了一种推理时搜索算法,使语言模型代理能够在交互式网页环境中执行显式的探索和多步规划。我们的方法是一种基于最佳优先(best-first)
feifeikon
·
2025-01-22 17:23
语言模型
人工智能
自然语言处理
DETRs with Collaborative Hybrid Assignments Training
论文阅读
与代码
关键词:协作混合分配训练【目标检测】Co-DETR:ATSS+FasterRCNN+DETR协作的先进检测器(ICCV2023)-CSDN博客摘要:在这篇论文中,作者观察到在DETR中将过少的Query分配为正样本,采用一对一的集合匹配,会导致对编码器输出的监督稀疏,严重损害编码器的区分特征学习,反之亦然,也会影响解码器中的注意力学习。为了缓解这个问题,作者提出了一种新颖的协同混合分配训练方案,名
分享总结快乐
·
2025-01-22 04:38
论文阅读
大模型GUI系列
论文阅读
DAY2续:《一个具备规划、长上下文理解和程序合成能力的真实世界Web代理》
摘要预训练的大语言模型(LLMs)近年来在自主网页自动化方面实现了更好的泛化能力和样本效率。然而,在真实世界的网站上,其性能仍然受到以下问题的影响:(1)开放领域的复杂性,(2)有限的上下文长度,(3)在HTML结构上的归纳偏差不足。我们提出WebAgent,一个由LLM驱动的智能代理,能够通过自我学习的方式,在真实网站上按照自然语言指令完成任务。WebAgent通过将指令提前规划,将其分解为子指
feifeikon
·
2025-01-21 15:19
论文阅读
论文阅读
笔记:AI+RPA
文章目录论文题目下载地址论文摘要论文题目Challengesandopportunities:ImplementingRPAandAIinfrauddetectioninthebankingsector下载地址点击这里下载论文摘要在银行业中,将机器人流程自动化(RPA)和人工智能(AI)集成用于欺诈检测是一项重大变革,既带来了挑战,也带来了机遇。随着金融机构面临日益复杂的欺诈企图,RPA和AI成为
几道之旅
·
2025-01-21 07:06
人工智能
论文阅读
:Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章,由google提出主要用来用轻量化的方法来实现高分辨率的图像生成,hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示,原始图像比如4k图像,首先分为两个主要模块:grid和guide。grid就是对应图上面的那一条特征提取网络,具体来说,原始图像经过下采样之后,默认256分
SetMaker
·
2025-01-20 22:47
论文阅读
【论文速读】| 利用大语言模型在灰盒
模糊测试
中生成初始种子
基本信息论文标题:HarnessingLargeLanguageModelsforSeedGenerationinGreyb0xFuzzing作者:WenxuanShi,YunhangZhang,XinyuXing,JunXu作者单位:NorthwesternUniversity,UniversityofUtah关键词:Greyb0xfuzzing,LargeLanguageModels,Seed
云起无垠
·
2025-01-18 17:52
论文速读/精读
语言模型
p2p
人工智能
PenGymy
论文阅读
这里发现idea被人家先发了,没办法,资料收集的不够全面,现在来学习一下这个项目这篇论文的贡献如下:总的来说,他的主要工作是构建逼真的仿真环境,然后根据这个仿真环境生成真实的靶场,使得这个智能体能够在这个真实的环境去互动。下面来逐渐解析他的工作,我尽量详细一点1、背景和动机这种项目是在网络攻防中,攻防双方攻击者处于暗面,防御者处于明面,这时候受到攻击后应急处理多少会造成损失,那么要是可以提前预测攻
亚里士多没有德775
·
2025-01-18 05:50
论文阅读
【论文速读】| Pipe-Cleaner:使用安全策略的灵活
模糊测试
基本信息原文标题:Pipe-Cleaner:FlexibleFuzzingUsingSecurityPolicies原文作者:AllisonNaaktgeboren,SeanNobleAnderson,AndrewTolmach,GregSullivan作者单位:PortlandStateUniversity,CharlesStarkDraperLaboratory关键词:fuzzing,secu
·
2025-01-17 19:08
漏洞框架
《互联网时代教师自主成长的模式研究》
论文阅读
与思考2
2.第二部分教师自主成长的模式建构,实质上是对新网师底层逻辑的描述。你认为,新网师的培训模式与传统常见的培训模式有哪些区别?这些区别有什么意义或价值?读完第二部分后,你对新网师有哪些新的认识或理解?你认为新网师目前哪些方面做得好,哪些方面做得还不够?答:我认为新网师的培训模式与传统常见的培训模式有以下区别:(1)培训对象的参与动机不同。新网师学员的参与是自觉自愿、积极主动,而传统培训更多是被迫参与
宁超群
·
2024-09-14 03:01
模糊测试
进阶,无状态
模糊测试
和不变式测试
系列文章目录
模糊测试
入门与assert()函数文章目录系列文章目录前言一、无状态
模糊测试
与不变
模糊测试
无状态
模糊测试
(StatelessFuzzTesting)不变式
模糊测试
(StatefulFuzzTesting
艾丽卡和木森的区块链日记
·
2024-09-13 06:38
区块链一些
区块链
【定位系列
论文阅读
】-Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition(一)
这里写目录标题概述研究内容Abstract第一段(介绍本文算法大致结构与优点)1.Introduction介绍第一段(介绍视觉位置识别的重要性)第二段(VPR的两种常见方法,本文方法结合了两种方法)第三段(本文贡献)第四段(为证明本文方法优越性,进行的测试以及比较)2.RelatedWork相关工作第一段(介绍早期与深度学习的全局图像描述符)第二段(介绍局部关键点描述符)第三段(局部描述符可以进一
醉酒柴柴
·
2024-09-11 21:32
论文阅读
学习
笔记
论文阅读
笔记(十九):YOLO9000: Better, Faster, Stronger
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
__Sunshine__
·
2024-09-11 21:59
笔记
YOLO9000
detection
classification
论文阅读
笔记: DINOv2: Learning Robust Visual Features without Supervision
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破,为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
小夏refresh
·
2024-09-11 20:50
论文
计算机视觉
深度学习
论文阅读
笔记
深度学习
计算机视觉
人工智能
周四 2020-01-09 08:00 - 24:30 多云 02h10m
二〇二〇年一月九日基本科研[1]:1.
论文阅读
论文--二小时十分2.论文实现实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:例会--英语能力
么得感情的日更机器
·
2024-09-08 23:58
【
论文阅读
】Mamba:选择状态空间模型的线性时间序列建模(二)
文章目录3.4一个简化的SSM结构3.5选择机制的性质3.5.1和门控机制的联系3.5.2选择机制的解释3.6额外的模型细节A讨论:选择机制C选择SSM的机制Mamba论文第一部分Mamba:选择状态空间模型的线性时间序列建模(一)3.4一个简化的SSM结构如同结构SSM,选择SSM是单独序列变换可以灵活地整合进神经网络。H3结构式最知名SSM结构地基础,其通常包括受线性注意力启发的和MLP交替地
syugyou
·
2024-09-08 15:52
Mamba状态空间模型
论文阅读
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning
论文阅读
笔记
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL,这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习(ML):集中收集数据->隐私保护问题privacy-preservingML(PPML)采
慘綠青年627
·
2024-09-06 10:44
论文阅读
笔记
深度学习
MixMAE(MixMIM):用于分层视觉变压器有效预训练的混合和掩码自编码器
论文阅读
论文:MixMAE(arxiv.org)代码:Sense-X/MixMIM:MixMIM:MixedandMaskedImageModelingforEfficientVisualRepresentationLearning(github.com)摘要:本文提出MixMAE(MixedandmaskAutoEncoder),这是一种简单而有效的预训练方法,适用于各种层次视觉变压器。现有的分层视觉变
皮卡丘ZPC
·
2024-09-06 08:04
扩散模型阅读
论文阅读
【
论文阅读
】LLM4CP: Adapting Large Language Models for Channel Prediction(2024)
摘要Channelprediction(信道预测)isaneffectiveapproach(有效方法)forreducingthefeedback(减少反馈)orestimationoverhead(估计开销)inmassivemulti-inputmulti-output(大规模多输入输出)(m-MIMO)systems.However,existingchannelpredictionmet
Bosenya12
·
2024-09-05 23:39
科研学习
论文阅读
语言模型
人工智能
信道预测
时间序列
【
论文阅读
】AugSteal: Advancing Model Steal With Data Augmentation in Active Learning Frameworks(2024)
摘要Withtheproliferationof(随着)machinelearningmodels(机器学习模型)indiverseapplications,theissueofmodelsecurity(模型的安全问题)hasincreasinglybecomeafocalpoint(日益成为人们关注的焦点).Modelstealattacks(模型窃取攻击)cancausesignifican
Bosenya12
·
2024-09-05 14:40
科研学习
模型窃取
论文阅读
模型窃取
模型提取
数据增强
主动学习
Bert系列:
论文阅读
Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline
一句话总结:提出LocalizedContrastiveEstimation(LCE),来优化检索排序。摘要预训练的深度语言模型(LM)在文本检索中表现出色。基于丰富的上下文匹配信息,深度LM微调重新排序器从候选集合中找出更为关联的内容。同时,深度lm也可以用来提高搜索索引,构建更好的召回。当前的reranker方法并不能完全探索到检索结果的效果。因此,本文提出了LocalizedContrast
凝眸伏笔
·
2024-09-04 01:37
nlp
论文阅读
bert
reranker
retrieval
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【
论文阅读
笔记】
此系列是本人阅读论文过程中的简单笔记,比较随意且具有严重的偏向性(偏向自己研究方向和感兴趣的),随缘分享,共同进步~论文主要内容:建立XL-MIMO模型,考虑NUSW信道和非平稳性;基于近场信道模型,分析性能(SNRscalinglaws,波束聚焦、速率、DoF)XL-MIMO设计问题:信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化:UPW➡NUSW空间平稳–>空间非平稳(可视区域
Cc小跟班
·
2024-09-03 08:22
【论文阅读】相关
论文阅读
笔记
论文阅读
:scMGCA----模型方法
Yu,Z.,Su,Y.,Lu,Y.etal.Topologicalidentificationandinterpretationforsingle-cellgeneregulationelucidationacrossmultipleplatformsusingscMGCA.NatCommun14,400(2023).https://doi.org/10.1038/s41467-023-36134
dundunmm
·
2024-09-03 07:46
论文阅读
论文阅读
人工智能
聚类
生物聚类
单细胞聚类
单细胞分析
论文阅读
:scHybridBERT
ZhangWei,WuChenjun,XingFeiyang,JiangMingfeng,ZhangYixuan,LiuQi,ShiZhuoxing,DaiQi,scHybridBERT:integratinggeneregulationandcellgraphforspatiotemporaldynamicsinsingle-cellclustering,BriefingsinBioinform
dundunmm
·
2024-09-03 07:42
论文阅读
机器学习
人工智能
神经网络
深度学习
单细胞基因测序
【
论文阅读
】Purloining Deep Learning Models Developed for an Ultrasound Scanner to a Competitor Machine
TheArtoftheSteal:PurloiningDeepLearningModelsDevelopedforanUltrasoundScannertoaCompetitorMachine(2024)摘要Atransferfunctionapproach(传递函数方法)hasrecentlyproveneffectiveforcalibratingdeeplearning(DL)algorit
Bosenya12
·
2024-09-02 06:40
科研学习
模型窃取
论文阅读
深度学习
人工智能
模型安全
《Motion Forecasting with Dual Consistency and Multi-Pseudo-Target Supervision》
论文阅读
之DCMS
目录摘要1简介2相关工作3.方法3.1结构3.2双重一致性约束3.3多伪目标监督3.4学习4实验4.1实验装置4.2实验结果4.3消融研究4.4泛化能力5限制6结论DCMS:具有双重一致性和多伪目标监督的运动预测香港科技大学暂无代码。摘要我们提出了一种具有双重一致性约束和多伪目标监督的运动预测新框架。运动预测任务通过结合过去的空间和时间信息来预测车辆的未来轨迹。DCMS的一个关键设计是提出双重一致
山水之间2018
·
2024-09-02 04:30
无人驾驶
Paper
Reading
大数据
轨迹预测
自动驾驶
人工智能
时序预测相关
论文阅读
笔记
笔记链接:【有道云笔记】读论文(记录)https://note.youdao.com/s/52ugLbot用于个人学习记录。
能力越小责任越小YA
·
2024-09-02 00:37
论文阅读
笔记
时序预测
Transformer
【
论文阅读
|cryoET】本周粗读汇总
论文1:CryoDRGN-ET:深度重建生成网络以可视化细胞内动态生物分子Abstract虽然冷冻电子断层扫描可以以分子分辨率揭示结构,但图像处理算法仍然是解决原位生物分子结构异质性的瓶颈。本文介绍CryoDRGN-ET用于cryoET断层图的异质重建。CryoDRGN-ET直接从子断层扫描倾斜系列图像中学习三维密度图的深度生成模型,并且可以捕获成分和构象不同的状态。通过原位恢复肺炎支原体核糖体中
吃吃今天努力学习了吗
·
2024-09-01 20:46
冷冻电镜三维重建
论文阅读
Your Diffusion Model is Secretly a Zero-Shot Classifier
论文阅读
笔记
YourDiffusionModelisSecretlyaZero-ShotClassifier
论文阅读
笔记这篇文章我感觉在智源大会上听到无数个大佬讨论,包括OpenAISora团队负责人,谢赛宁,好像还有杨植麟
Rising_Flashlight
·
2024-09-01 20:46
论文阅读
笔记
计算机视觉
【
论文阅读
】QUEEN: Query Unlearning against Model Extraction(2024)
摘要Modelextractionattacks(模型提取攻击)currentlyposeanon-negligiblethreat(不可忽视的威胁)tothesecurity(安全性)andprivacy(隐私性)ofdeeplearningmodels.Byqueryingthemodelwithasmalldataset(通过小数据集查询模型)andusingthequeryresultsa
Bosenya12
·
2024-09-01 20:45
科研学习
模型窃取
论文阅读
提取攻击
模型安全
【
论文阅读
33】Deep learning optoacoustic tomography with sparse data
Deeplearningoptoacoustictomographywithsparsedata论文题目:基于稀疏数据的深度学习光声断层扫描论文链接:Deeplearningoptoacoustictomographywithsparsedata|NatureMachineIntelligence代码链接:GitHub-ndavoudi/sparse_artefact_unet数据链接:Data发
弹伦琴的雷登
·
2024-09-01 18:29
【论文阅读系列】
人工智能
深度学习
论文阅读
图像处理
智能合约漏洞检测论文
综述TestingEthereumSmartContracts:AComparisonofSymbolicAnalysisandFuzzTestingTools符号执行与
模糊测试
工具的比较综述DeepLearningBasedVulnerabilityDetection
weixin_45332030
·
2024-08-31 04:51
智能合约
论文阅读
瞎记(四) Cascade R-CNN: Delving into High Quality Object Detection 2017
概述在物体检测中1,IOU阈值被用于判定正负样本。在低IOU阈值比如0.5的状态下训练模型经常产生噪音预测,然而检测效果会随着IOU增加而降低。两个主要因素:1.训练时的过拟合,正样本指数消失2.检测器最优IOU与输入假设的不匹配。一个单阶段的物体检测器CascadeR-CNN被提出用于解决这些问题。网络由一个检测序列组成,这些序列训练时会伴随IOU增长从而对FP样本更加有选择性地判别。检测器一个
码大哥
·
2024-08-30 15:58
深度学习
人工智能
assert()在solidity的运用,
模糊测试
案例
文章目录前言一、assert()函数介绍二、solidity使用举例foundry测试的举例被测试的合约:StatelessFuzzCatches测试合约:StatelessFuzzCatchesTest测试过程问题和改进前言介绍了assert()函数,此类函数多用于区块连测试中,结尾距离foundry中的案例一、assert()函数介绍在Solidity中,assert()是一个断言函数,用于测
zhuqiyua
·
2024-08-29 20:19
区块链一些
区块链
【
论文阅读
】LLM4SGG: Large Language Models for Weakly Supervised Scene Graph Generation
【
论文阅读
】LLM4SGG:LargeLanguageModelsforWeaklySupervisedSceneGraphGenerationabstract由于全监督方法严重依赖昂贵标注,最近弱监督场景图生成
进击的乔洋
·
2024-08-28 19:03
论文阅读
语言模型
人工智能
计算机视觉
Code Llama: Open Foundation Models for Code
论文阅读
整体介绍CodeLlama发布了3款模型,包括基础模型、Python专有模型和指令跟随模型,参数量分别为7B、13B、34B和70B。这些模型在长达16ktokens的序列上训练。都是基于Llama2。作者针对infilling(FIM)、长上下文、指令专门做了微调long-contextfine-tuning(LCFT).codellama细节CodeLlama模型家族初始化:所有CodeLla
yang_daxia
·
2024-08-27 18:46
大模型
llama
codellama
【
论文阅读
】Model Stealing Attacks Against Inductive Graph Neural Networks(2021)
摘要Manyreal-worlddata(真实世界的数据)comeintheformofgraphs(以图片的形式).Graphneuralnetworks(GNNs图神经网络),anewfamilyofmachinelearning(ML)models,havebeenproposedtofullyleveragegraphdata(充分利用图数据)tobuildpowerfulapplicat
Bosenya12
·
2024-08-26 12:29
科研学习
模型窃取
论文阅读
图神经网络
模型窃取
VIT
论文阅读
: A Image is Worth 16x16 Words
简介在2024年,大家都知道了transformer的故事,但是在4年前,CNN和Transformer谁才是CV的未来,还没有那么确定。在简介部分,作者提到了一个令人失望的事实,在基于imagenet的实验中发现,transformer的表现差于同尺寸的ResNet。作者把原因归结到biastranslationequivarianceandlocality,这些CNN具有,但是transfor
Undefined游侠
·
2024-08-24 17:37
论文阅读
【
论文阅读
】GLiRA: Black-Box Membership Inference Attack via Knowledge Distillation
摘要While(虽然)DeepNeuralNetworks(DNNs)havedemonstratedremarkableperformanceintasksrelatedtoperception(感知)andcontrol(控制),therearestillseveralunresolvedconcerns(未解决的问题)regardingtheprivacyoftheirtrainingdat
Bosenya12
·
2024-08-24 16:35
模型窃取
科研学习
论文阅读
知识蒸馏
成员推理攻击
黑盒
【
论文阅读
】APMSA: Adversarial Perturbation Against Model Stealing Attacks(2023)
摘要TrainingaDeepLearning(DL)model(训练深度学习模型)requiresproprietarydata(专有数据)andcomputing-intensiveresources(计算密集型资源).Torecouptheirtrainingcosts(收回训练成本),amodelprovidercanmonetizeDLmodelsthroughMachineLearni
Bosenya12
·
2024-08-24 16:04
科研学习
模型窃取
论文阅读
模型窃取
防御
对抗性扰动
Conditional Flow Matching: Simulation-Free Dynamic Optimal Transport
论文阅读
笔记
ConditionalFlowMatching:Simulation-FreeDynamicOptimalTransport笔记发现问题连续正规化流(CNF)是一种有吸引力的生成式建模技术,但在基于模拟的最大似然训练中受到了限制。解决问题介绍一种新的条件流匹配(CFM),一种针对CNFs的免模拟训练目标。具有稳定的回归目标,用于扩散模型中的随机流,但享有确定性流模型的有效推断。与扩散模型和CNF目
猪猪想上树
·
2024-08-23 03:06
论文阅读
笔记
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他