E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
arxiv
DeepSeek:LLM在MoE训练中的无损平衡
标题:AUXILIARY-LOSS-FREELOADBALANCINGSTRAT-EGYFORMIXTURE-OF-EXPERTS来源:
arXiv
,2408.15664摘要对于混合专家(MoE)模型,不平衡的专家负载将导致路由崩溃或计算开销增加
大模型任我行
·
2025-01-30 16:24
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
ModelNet40-C 项目使用教程
ModelNet40-CRepofor"BenchmarkingRobustnessof3DPointCloudRecognitionagainstCommonCorruptions"https://
arxiv
.org
薛烈珑Una
·
2025-01-30 11:47
【YOLOv11改进- 主干网络】YOLOv11+TransNext特征提取网络(CVPR2024): 基于YOLOv11的主干网络改进超轻量;
TransNext介绍摘要亮点优势3.TransNext网络结构图4.yolov11-transNextyaml文件5.TransNext代码实现6.TransNext添加方式论文地址:http://
arxiv
.org
算法conv_er
·
2025-01-30 02:12
YOLOv11目标检测改进
YOLO
网络
人工智能
深度学习
机器学习
目标检测
【DeepSeek】大模型强化学习训练GRPO算法,你学会了吗?
GRPO原论文链接:https://
arxiv
.org/abs/2402.03300GRPO中译文链接:ht
FF-Studio
·
2025-01-29 21:56
DeepSeek
R1
算法
CT-Mamba:一种用于低剂量CT降噪的混合卷积状态空间模型 论文解读
本文参考了该网站,其对CT-Mamba提供了更详细的描述:https://www.aimodels.fyi/papers/
arxiv
/ct-mamba-hybrid-convolutio
ZcZc__1
·
2025-01-28 17:52
深度学习
人工智能
图像处理
[论文笔记] Megatron: mistral sliding window(ImportError: /workspace/venv/lib/python3.10/site-packag报错解决)
pyTorch—TransformerEngine1.2.1documentation论文:https://
arxiv
.org/pdf/2310.06825.pdftransformerengine的slidingwindow
心心喵
·
2025-01-28 00:46
论文笔记
论文阅读
ViT论文解读
YiZhu大佬对于ICLR2021的一篇论文精读ANIMAGEISWORTH16x16WORDS:TRANSFORMERSFORIMAGERECOGNITIONATSCALE论文地址:https://
arxiv
.org
freshfish丶
·
2025-01-27 18:35
文献阅读
深度学习
计算机视觉
transformer
[论文精读]Understanding Diffusion Models: A Unified Perspective
发布链接:http://
arxiv
.org/abs/2208.11970文章详细讨论了扩散模型(DiffusionModels)作为一种生成模型的工作原理,并从多个角度解释其背后的数学机制。
0x211
·
2025-01-27 16:26
论文精读
数学建模
Direct Preference Optimization (DPO): 一种无需强化学习的语言模型偏好优化方法
论文地址:https://
arxiv
.org/pdf/2305.182901.背景与挑战近年来,大规模无监督语言模型(LM)在知识获取和推理能力方面取得了显著进展,但如何精确控制其行为仍是一个难题。
Yuleave
·
2025-01-26 09:12
论文学习
语言模型
人工智能
自然语言处理
Qwen-VL: 一种多功能的视觉-语言模型,用于理解、定位、文本阅读等
Qwen-VL:AVersatileVision-LanguageModelforUnderstanding,Localization,TextReading,andBeyond论文地址:https://
arxiv
.org
&永恒的星河&
·
2025-01-25 01:04
LLMs
LVLMs
LLMs
【cs.AI】25.1.11
arxiv
更新速递
25.1.1012:00-25.1.1112:00共更新75篇—第1篇----=====MultilingualPerformanceofaMultimodalArtificialIntelligenceSystemonMultisubjectPhysicsConceptInventories关键词:多语言,多模态,人工智能,GPT-4,物理教育,物理概念清单链接1摘要:我们研究了一种基于大型语言
hinmer
·
2025-01-24 02:34
arxiv
cs.AI每日更新
chatgpt
gpt
人工智能
自然语言处理
自动驾驶
深度学习
aigc
【LLM】25.1.11
Arxiv
LLM论文速递
25.1.1012:00-25.1.1112:00共更新36篇—第1篇----=====Supervisionpoliciescanshapelong-termriskmanagementingeneral-purposeAImodels关键词:通用型人工智能,风险管理,监督政策,模拟框架PDF链接摘要:通用型人工智能(GPAI)模型,包括大型语言模型(LLM)的快速普及和部署,给AI监管实体带来
hinmer
·
2025-01-24 02:33
arxiv
LLM每日更新
chatgpt
gpt
人工智能
自然语言处理
ai
aigc
深度学习
【CV】25.1.7
arxiv
更新速递
—第1篇----关键词:手势识别,计算机视觉,低光照条件,机器学习,RaspberryPi,OpenCV论文链接-摘要:手势识别是一种基于计算机视觉技术的感知用户界面,允许计算机将人类动作解释为命令,使用户无需使用手与计算机交流,从而使鼠标和键盘变得多余。手势识别的主要弱点是光线条件,因为手势控制依赖于摄像头。摄像头用于在2D和3D中解释手势,因此提取的信息可能因光源而异。系统的限制是无法在黑暗环
hinmer
·
2025-01-24 02:03
arxiv
CV每日更新
python
人工智能
计算机视觉
chatgpt
目标检测
ai
AIGC
【MotionCap】DROID-SLAM 1 :介绍及安装
DROID-SLAM:DeepVisualSLAMforMonocularDROID-SLAM:适用于单目、立体和RGB-D相机的深度视觉SLAMStereo,andRGB-DCamerashttps://
arxiv
.org
等风来不如迎风去
·
2025-01-23 22:38
AI入门与实战
人工智能
SLAHMR
DROID-SLAM
[OpenAI Codex] Evaluating Large Language Models Trained on Code
Linkofpaper:https://
arxiv
.org/abs/2107.03374.EvaluatingLargeLanguageModelsTrainedonCodeIntroductionCodexisaGPT-basedmodelfine-tunedonpubliccodefromGitHub
ShadyPi
·
2025-01-23 04:17
自然语言处理
AIGC
语言模型
人工智能
自然语言处理
【Block总结】CDFA,对比驱动特征聚合模块|即插即用,极大增强特征表达!
AGeneralMedicalImageSegmentationFrameworkviaContrast-DrivenFeatureEnhancement作者:MengqiLei,HaochenWu,XinhuaLv,XinWang机构:中国地质大学(武汉),百度公司发表时间:2024年12月11日会议:AAAI2025论文:https://
arxiv
.org
AI浩
·
2025-01-19 23:55
Block总结
计算机视觉
深度学习
目标检测
【cs.CV】25.1.14
arxiv
更新速递
【cs.CV】25.1.14
arxiv
更新110篇—第1篇----=====Omni-RGPT:UnifyingImageandVideoRegion-levelUnderstandingviaTokenMarks
hinmer
·
2025-01-19 03:25
CV每日更新
arxiv
chatgpt
gpt
人工智能
自然语言处理
自动驾驶
计算机视觉
ai
【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model
论文原文链接:https://
arxiv
.org/abs/2409.01704特别声明,本文不做任何商业用途,仅作为个人学习相关论文的翻译记录。
机器白学
·
2025-01-18 18:57
论文翻译
ocr
论文阅读
论文翻译
RTDETR融合[WACV 2024]的MetaSeg中的gmb模块
MetaSeg:MetaFormer-basedGlobalContexts-awareNetworkforEfficientSemanticSegmentation》一、模块介绍论文链接:https://
arxiv
.org
今天炼丹了吗
·
2025-01-16 20:04
RT-DETR涨点改进专栏
RT-DETR
ResNet的半监督和半弱监督模型
Billion-scalesemi-supervisedlearningforimageclassificationhttps://
arxiv
.org/pdf/1905.00546.pdfhttps:/
Valar_Morghulis
·
2024-09-15 11:49
arXiv
综述论文“Graph Neural Networks: A Review of Methods and Applications”
arXiv
于2019年7月10日上载的GNN综述论文“GraphNeuralNetworks:AReviewofMethodsandApplications“。
硅谷秋水
·
2024-09-13 14:27
自动驾驶
R-Drop pytorch实现
#-*-coding:utf-8-*-"""Description:AnimplementationofR-Drop(https://
arxiv
.org/pdf/2106.14448.pdf).Authors
warpin
·
2024-09-12 21:39
深度学习
深度学习
pytorch
论文翻译:
arxiv
-2022 Ignore Previous Prompt: Attack Techniques For Language Models
IgnorePreviousPrompt:AttackTechniquesForLanguageModelshttps://
arxiv
.org/pdf/2211.09527忽略之前的提示:针对语言模型的攻击技术文章目录忽略之前的提示
CSPhD-winston-杨帆
·
2024-09-12 12:14
论文翻译
LLMs-安全
prompt
语言模型
人工智能
AI推介-多模态视觉语言模型VLMs论文速览(
arXiv
方向):2024.07.25-2024.08.01
文章目录~1.PayingMoreAttentiontoImage:ATraining-FreeMethodforAlleviatingHallucinationinLVLMs2.MTA-CLIP:Language-GuidedSemanticSegmentationwithMask-TextAlignment3.MarvelOVD:MarryingObjectRecognitionandVisi
小小帅AIGC
·
2024-09-12 06:37
VLM论文时报
人工智能
语言模型
自然语言处理
VLM
大语言模型
计算机视觉
视觉语言模型
探索任务的隐秘世界:推荐Task2Vec
探索任务的隐秘世界:推荐Task2Vecaws-cv-task2vecOfficialcodeforthepaper"Task2Vec:TaskEmbeddingforMeta-Learning"(https://
arxiv
.org
邓越浪Henry
·
2024-09-11 22:06
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://
arxiv
.org/abs/2304.07193代码地址:https:
小夏refresh
·
2024-09-11 20:50
论文
计算机视觉
深度学习
论文阅读
笔记
深度学习
计算机视觉
人工智能
论文翻译:
arxiv
-2024 Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large
DataContaminationQuiz:ATooltoDetectandEstimateContaminationinLargeLanguageModelshttps://
arxiv
.org/abs
CSPhD-winston-杨帆
·
2024-09-09 14:28
LLMs-数据污染
论文翻译
语言模型
人工智能
深度学习
【神经网络系列(高级)】神经网络Grokking现象的电路效率公式——揭秘学习飞跃的秘密【通俗理解】
【通俗理解】神经网络Grokking现象的电路效率公式论文地址:https://
arxiv
.org/abs/2309.02390参考链接:[1]https://x.com/VikrantVarma_/status
神经美学_茂森
·
2024-09-09 14:54
神经网络
人工智能算法
神经网络
学习
人工智能
YOLOv8改进 更换轻量级网络结构
一、GhostNet论文论文地址:1911.11907.pdf(
arxiv
.org)二、GhostNet结构GhostNet是一种高效的目标检测网络,具有较低的计算复杂度和较高的准确性。
学yolo的小白
·
2024-09-08 08:37
Upgrade
YOLOv8进阶
YOLO
目标检测
深度学习
LeYOLO 用于目标检测的新型可扩展和高效CNN架构 | 最新轻量化SOTA! 5GFLOP下无对手!
论文地址:https://
arxiv
.org/pdf/2406.14239代码地址:https://github.com/LilianHollard/LeYOLO/tree/main在深度神经网络中,计算效率对于目标检测至关重要
迪菲赫尔曼
·
2024-09-08 02:21
YOLOv8改进实战
目标检测
cnn
架构
pytorch
深度学习
轻量化
AI推介-多模态视觉语言模型VLMs论文速览(
arXiv
方向):2024.04.15-2024.04.25
文章目录~1.AutoGluon-Multimodal(AutoMM):SuperchargingMultimodalAutoMLwithFoundationModels2.FusionofDomain-AdaptedVisionandLanguageModelsforMedicalVisualQuestionAnswering3.CatLIP:CLIP-levelVisualRecognitio
小小帅AIGC
·
2024-09-07 21:49
VLM论文时报
人工智能
语言模型
自然语言处理
VLM
视觉语言模型
多模态
计算机视觉
LLM之RAG理论(十二)| RAG和Graph RAG对比
GraphRAG非常火,它来自微软的一篇论文《FromLocaltoGlobal:AGraphRAGApproachtoQuery-FocusedSummarization》,论文地址:https://
arxiv
.org
wshzd
·
2024-09-06 14:18
RAG
笔记
人工智能
百篇论文博文导航AI工程之路:FT、KG、RAG与Agent技术全方位探索
AI工程之路:FT、KG、RAG与Agent技术全方位探索1.FTScalingDowntoScaleUp:AGuidetoParameter-EfficientFine-Tuning:https://
arxiv
.org
汀、人工智能
·
2024-09-06 12:00
AI
Agent
人工智能
深度学习
机器学习
自然语言处理
大模型
Agent
RAG
MixMAE(MixMIM):用于分层视觉变压器有效预训练的混合和掩码自编码器 论文阅读
论文:MixMAE(
arxiv
.org)代码:Sense-X/MixMIM:MixMIM:MixedandMaskedImageModelingforEfficientVisualRepresentationLearning
皮卡丘ZPC
·
2024-09-06 08:04
扩散模型阅读
论文阅读
Simple Pose: Rethinking and Improving a Bottom-up Approach for Multi-Person Pose Estimation
arxiv
:https://
arxiv
.org/pdf/1911.10529.pdfgithub:https://github.com/jialee93/Improved-Body-Parts原作者在知乎有讲解
MatthewHsw
·
2024-09-04 01:06
Simple
Pose
计算机视觉之 GSoP 注意力模块
原论文:《GlobalSecond-orderPoolingConvolutionalNetworks(
arxiv
.org)》二、语法和
Midsummer-逐梦
·
2024-09-03 12:18
计算机视觉(CV)
深度学习
机器学习
人工智能
论文浅尝 - AAAI2020 | 迈向建立多语言义元知识库:用于 BabelNet Synsets 义元预测...
来源:AAAI2020链接:https://
arxiv
.org/pdf/1912.01795.pdf摘要义原被定义为人类语言的最小语义单位。
开放知识图谱
·
2024-08-30 07:35
机器学习
人工智能
知识图谱
自然语言处理
深度学习
【CVPR‘24】BP-Net:用于深度补全的双边传播网络,新 SOTA!
BilateralPropagationModule)深度参数化参数生成先验编码3.多模态融合(Multi-modalFusion)4.深度细化(DepthRefinement)5.损失函数结果与分析结论论文地址:https://
arxiv
.org
BIT可达鸭
·
2024-08-30 04:50
深度补全:从入门到放弃
网络
KITTI
计算机视觉
cvpr
深度估计
ETH:通过文本反馈提高LLM对齐能力
标题:TowardsAligningLanguageModelswithTextualFeedback来源:
arXiv
,2407.16970️文章简介研究问题:如何通过文本反馈来调整语言模型,使其生成更符合用户期望的行为
大模型任我行
·
2024-08-28 15:02
大模型-模型训练
人工智能
自然语言处理
语言模型
UNDERSTANDING HTML WITH LARGE LANGUAGE MODELS
UNDERSTANDINGHTMLWITHLARGELANGUAGEMODELS相关链接:
arXiv
关键字:大型语言模型、HTML理解、Web自动化、自然语言处理、机器学习摘要大型语言模型(LLMs)在各种自然语言任务上表现出色
liferecords
·
2024-03-28 21:56
LLM
语言模型
人工智能
自然语言处理
AI推介-大语言模型LLMs论文速览(
arXiv
方向):2024.03.20-2024.03.25
文章目录~1.IterativeRefinementofProject-LevelCodeContextforPreciseCodeGenerationwithCompilerFeedback2.TrustAIatSemEval-2024Task8:AComprehensiveAnalysisofMulti-domainMachineGeneratedTextDetectionTechniques
小小帅AIGC
·
2024-03-26 20:39
LLMs论文时报
人工智能
语言模型
自然语言处理
LLM
大语言模型
论文推送
深度学习
AI推介-大语言模型LLMs论文速览(
arXiv
方向):2024.02.20-2024.02.25
论文目录~1.Zero-shotcross-lingualtransferininstructiontuningoflargelanguagemodel2.ScalingEfficientLLMs3.LLM-DA:DataAugmentationviaLargeLanguageModelsforFew-ShotNamedEntityRecognition4.WhoseLLMisitAnyway?L
小小帅AIGC
·
2024-03-26 20:39
LLMs论文时报
人工智能
语言模型
深度学习
LLM
大语言模型
论文推送
YOLOv9改进 添加可变形注意力机制DAttention
一、DeformableAttentionTransformer论文论文地址:
arxiv
.org/pdf/2201.00520.pdf二、DeformableAttentionTransformer注意力结构
学yolo的小白
·
2024-03-16 05:06
UPgrade
YOLOv9
YOLO
python
目标检测
pytorch
Simple and Scalable Strategies to Continually Pre-train Large Language Models
SimpleandScalableStrategiestoContinuallyPre-trainLargeLanguageModels相关链接:
arxiv
关键字:LargeLanguageModels
liferecords
·
2024-03-14 20:18
LLM
语言模型
深度学习
神经网络
论文翻译 - BITE: Textual Backdoor Attacks with Iterative Trigger Injection
论文链接:https://
arxiv
.org/pdf/2205.12700.pdf项目代码:https://github.com/INK-USC/BITEBITE:TextualBackdoorAttackswithIterativeTriggerInjectionAbstract1Introduction2ThreatModel3Methodology3.1BiasMeasurementonLa
anniewwy
·
2024-03-13 13:37
LLM
Backdoor
Attack
High-Resolution Image Synthesis with Latent Diffusion Models
一、简介标题:High-ResolutionImageSynthesiswithLatentDiffusionModels(https://
arxiv
.org/pdf/2112.10752.pdf;GitHub-CompVis
仁义礼智信达
·
2024-03-09 14:41
深度学习
扩散模型
CVPR
超分辨率重建
知识图谱最新权威综述论文解读:实体发现
论文地址:https://
arxiv
.org/pdf/2002.00388.pdfarxiv.org1实体发现本节将基于实体的知识获取区分为若干细分任务,
ngl567
·
2024-03-07 17:45
AI推介-大语言模型LLMs论文速览(
arXiv
方向):2024.02.25-2024.03.01
论文目录~1.ArithmeticControlofLLMsforDiverseUserPreferences:DirectionalPreferenceAlignmentwithMulti-ObjectiveRewards2.KeepingLLMsAlignedAfterFine-tuning:TheCrucialRoleofPromptTemplates3.Meta-TaskPrompting
小小帅AIGC
·
2024-03-06 03:25
LLMs论文时报
人工智能
语言模型
自然语言处理
LLM
大语言模型
深度学习
论文推送
【眼科大模型】Ophtha-LLaMA2:视觉模型提取图像特征 + LLM基于特征生成眼底病变的诊断报告
Ophtha-LLaMA2:视觉模型提取图像特征+LLM基于特征生成眼底病变的诊断报告提出背景设计思路选择大模型基座生成诊断报告论文:https://
arxiv
.org/pdf/2312.04906.pdf
Debroon
·
2024-02-20 16:34
医学大模型:个性化精准安全可控
计算机视觉
人工智能
phaseDNN文章解读
文章DOI:https://doi.org/10.48550/
arXiv
.1905.01389作者是SouthernMethodistUniversity的WeiCai教授AParallelPhaseShiftDeepNeuralNetworkforAdaptiveWidebandLearning
凭轩听雨199407
·
2024-02-20 13:15
神经网络
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他