E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
arxiv
大模型微调方法之Delta-tuning
大模型微调方法之Delta-tuning大模型微调方法自从23年之后可谓是百花齐放,浙大有团队在8月将关于大模型微调方法的综述上传了
ArXiv
。论文将微调方法总结为等几个类别。
空 白II
·
2025-03-24 20:09
大语言模型
论文解读
微调方法介绍
微调方法
delta-tuning
论文解读
大语言模型
论文阅读:2023
arxiv
Multiscale Positive-Unlabeled Detection of AI-Generated Texts
blog.csdn.net/WhiffeYF/article/details/142132328MultiscalePositive-UnlabeledDetectionofAI-GeneratedTextshttps://
arxiv
.org
CSPhD-winston-杨帆
·
2025-03-23 22:32
论文阅读
论文阅读
人工智能
Ubuntu和Windows系统之Mamba_ssm安装
Mamba的论文:https://
arxiv
.org/abs/2312.00752Mamba的github:https://github.com/state-spaces/mamba一、Ubuntu安装直接新建一个环境是最好的
Netceor
·
2025-03-23 04:50
Python
ubuntu
windows
linux
如何评估一个RAG系统(RAGas评测框架)-下篇
下面是RAGas的一些链接论文:https://
arxiv
.org/pdf/2309.15217官方文档:Ragashttps://github.com/explodinggradients/ragas
写程序的小火箭
·
2025-03-22 05:13
大语言模型
人工智能
语言模型
chatgpt
langchain
gpt
HRM:分层多步奖励模型
论文标题TowardsHierarchicalMulti-StepRewardModelsforEnhancedReasoninginLargeLanguageModels论文地址https://
arxiv
.org
大模型最新论文速读
·
2025-03-21 18:39
深度学习
语言模型
人工智能
自然语言处理
谷歌:对比学习将LLM转为嵌入模型
标题:GeminiEmbedding:GeneralizableEmbeddingsfromGemini来源:
arXiv
,2503.07891摘要在本报告中,我们介绍了Gemini嵌入,这是一种最先进的嵌入模型
大模型任我行
·
2025-03-21 13:59
大模型-成熟基座
人工智能
自然语言处理
语言模型
论文笔记
复旦:过程奖励优化多模态推理
标题:VisualPRM:AnEffectiveProcessRewardModelforMultimodalReasoning来源:
arXiv
,2503.10291摘要我们引入了VisualPRM,这是一种具有
大模型任我行
·
2025-03-20 13:59
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
复旦:LLM不同层位置编码缩放
标题:Layer-SpecificScalingofPositionalEncodingsforSuperiorLong-ContextModeling来源:
arXiv
,2503.04355摘要尽管大型语言模型
大模型任我行
·
2025-03-19 16:12
大模型-结构原理
人工智能
自然语言处理
语言模型
论文笔记
论文阅读:Deep Stacked Hierarchical Multi-patch Network for Image Deblurring
文章:
ArXiv
代码:Github在去模糊领域,目前的多尺度和尺度循环模型存在一些问题:1)由粗到细方案中的去卷积/上采样操作导致运行时间昂贵;2
行走的歌
·
2025-03-18 09:26
文献阅读
图像处理
计算机视觉
机器学习
深度学习
图像去雨
图像处理
rStar论文精读
论文简介论文标题:《MutualreasoningmakessmallerLLMsstrongerproblem-solvers》论文地址:https://
arxiv
.org/abs/2408.06195
MoyiTech
·
2025-03-17 11:33
推理模型
OpenAI-O1原理
AI推介-大语言模型LLMs论文速览(
arXiv
方向):2024.06.25-2024.07.01
文章目录~1.AutoCherry-Picker:LearningfromHigh-qualityGenerativeDataDrivenbyLanguage2.BioMNER:ADatasetforBiomedicalMethodEntityRecognition3.BESTOW:EfficientandStreamableSpeechLanguageModelwiththeBestofTwoW
小小帅AIGC
·
2025-03-15 05:10
LLMs论文时报
人工智能
语言模型
深度学习
自然语言处理
大语言模型
LLM
多分类—微调DistilBERT对生物医学文本进行实验方法多分类:Automated Text Mining of Experimental Methodologies from Biomedical
AutomatedTextMiningofExperimentalMethodologiesfromBiomedicalLiterature从生物医学文献中自动挖掘实验方法文本paper:https://
arxiv
.org
小小帅AIGC
·
2025-03-14 23:56
information
extraction
人工智能
自然语言处理
语言模型
多分类
学术领域
生物医学
[Base]DIFFERENTIAL TRANSFORMER
1.BaseInfoTitleDIFFERENTIALTRANSFORMERAdresshttps://
arxiv
.org/pdf/2410.05258Journal/Time202410Author微软研究院和清华大学提出
Xy-unu
·
2025-03-13 18:09
transformer
深度学习
人工智能
selectdataset 发布2024最热门Top100数据集
首页有最新的数据集推荐:GitHub、HuggingFace、
arXiv
这些热门站点,都属于日级别的更新。
·
2025-03-11 20:06
数据集
LLM论文笔记 20: How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning
Arxiv
日期:2024.5.16机构:IIT关键词CoT本质LLM推理本质核心结论1.CoT推理的功能组件尽管不同阶段的推理任务具有不同的推理需求,模型内部的功能组件几乎是相同的(共享而非独享)不同的神经算法实际上是由类似归纳头
Zhouqi_Hua
·
2025-03-11 03:10
大模型论文阅读
人工智能
chatgpt
论文阅读
机器学习
深度学习
语言模型
[
arxiv
论文解读]LlamaFactory:100+语言模型统一高效微调
该文档是一篇关于LLAMAFACTORY的学术论文,这是一个用于高效微调大型语言模型(LLMs)的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估,以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释:摘要(Abstract)背景:大型语言模型(LLMs)在多种应用中展现了卓越的推理能力,但需要有效的微调方法来适应下游任务。问题:现有的高效微调方法缺乏一个系统化
强化学习曾小健
·
2025-03-10 07:22
#
LLM大语言模型
语言模型
人工智能
自然语言处理
使用LangChain实现最新NLP研究成果
在本文中,我们将探讨一些被LangChain所引用的
arXiv
研究论文,并展示如何通过API调用和具体示例来实现这些前沿技术。
eahba
·
2025-03-10 05:33
langchain
自然语言处理
人工智能
python
[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比
https://
arxiv
.org/pdf/2407.21075https://
arxiv
.org/pdf/2407.10671https://
arxiv
.org/pdf/2407.21783LLaMA3.1LLaMA3.1
心心喵
·
2025-03-10 01:02
论文笔记
论文阅读
深度学习
人工智能
(ECCV2018)CBAM改进思路
论文链接:https://
arxiv
.org/abs/1807.06521论文题目:CBAM:ConvolutionalBlockAttentionModule会议:ECCV2018论文方法利用特征的通道间关系生成了一个通道注意图
这张生成的图像能检测吗
·
2025-03-09 19:12
即插即用模块+改进思路
深度学习
人工智能
计算机视觉
机器学习
图像处理
神经网络
论文笔记
论文阅读:Recipe for a General, Powerful, Scalable Graph Transformer
1介绍与贡献2GPS模型2.1模型框架图2.2PE和SE2.3GPSlayer:一种MPNN+Transformer的混合模型GraphTransformer)论文和代码地址论文地址:https://
arxiv
.org
不会&编程
·
2025-03-08 16:53
图神经网络论文阅读
论文阅读
transformer
深度学习
图神经网络
人工智能
MoE-FFD:Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection
来源:2024
arXiv
(submittedTDSC,CCF-A)作者:ChenqiKong1,AnweiLuo2,PeijunBao1,YiYu1,HaoliangLi3,ZengweiZheng4,
Sherry Wangs
·
2025-03-07 15:44
Deepfake
Detection
人工智能
pytorch
X-LoRA:高效微调 LoRA 系列,实现不同领域知识专家混合模型
aFlexibleFrameworkforLargeLanguageModelswithApplicationsinProteinMechanicsandMolecularDesign作者:EricL.Buehler;MarkusJ.BuehlerDOI:10.48550/
arXiv
yumuing blog
·
2025-03-05 22:22
前沿论文解读
llama
人工智能
语言模型
Self-Attentive Sequential Recommendation论文阅读笔记
发表于:2018ICDM作者:Wang-ChengKang,JulianMcAuley论文代码:https://github.com/pmixer/SASRec.pytorch论文地址:https://
arxiv
.org
调包调参侠
·
2025-03-05 06:39
推荐系统学习
深度学习
机器学习
神经网络
算法
端到端自动驾驶——cnn网络搭建
论文参考:https://
arxiv
.org/abs/1604.07316demo今天主要来看一个如何通过图像直接到控制的自动驾驶端到端的项目,首先需要配置好我的仿真环境,下载软件udacity:https
白云千载尽
·
2025-03-04 15:10
自动驾驶
cnn
人工智能
ROS
算法
神经网络
机器学习
批量下载
arXiv
论文数据的Python脚本
arXiv
-toolsPrerequisitesArXivprovidesbulkdataaccessthroughAmazonS3.YouneedanaccountwithAmazonAWStobeabletodownloadthedata.Youalsoneedpython2
hajungong007
·
2025-03-04 01:25
python
【
arxiv
2024】T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation
【
arxiv
2024】T2V-CompBench:AComprehensiveBenchmarkforCompositionalText-to-videoGeneration一、前言Abstract1Introduction2Relatedwork3BenchmarkConstruction3.1PromptGeneration3.2PromptCategories3.3PromptSuiteSt
旋转的油纸伞
·
2025-03-02 16:40
视频生成/视频理解
T2V
Sora
人工智能
python
职场和发展
Meta:基于数据关系的LLM高效预训练
标题:Data-EfficientPretrainingwithGroup-LevelDataInfluenceModeling来源:
arXiv
,2502.14709摘要数据高效的预训练已显示出提高缩放定律的巨大潜力
大模型任我行
·
2025-03-01 12:37
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
使用
arxiv
提供的API爬取文章信息
大致阅读了一下
arxiv
提供的文档,里面4.1.SimpleExamples部分提供了4种语言的API请求样例。我的需求是使用Python,所以直接复制粘贴了。
ye6
·
2025-03-01 10:46
爬虫
python
python爬取
arXiv
论文元数据
需要相关学科、主题的论文元数据做一些分析,
arXiv
开源,容易获取。
小孔不爱coding
·
2025-03-01 10:46
python
开发语言
网络爬虫
arxiv
论文爬虫
文章目录readmeArxivInterestingPapersCrawlerDescription:Thetimerangeofthepaperdownloading:Themodeofthedownloading:Therootofthedownloading:Thedomainofthedownloading:Thecustomizedkeywords:Thecustomizedkeywor
plasma-deeplearning
·
2025-03-01 09:39
pycharm
ar
爬虫
如何用Python 3调用
ArXiv
API查询
ArXiv
论文元数据
arXivAPIAccess-arXivinfoarXivAPIBasics-arXivinfoarXivAPIUser’sManual-arXivinfo文章目录1.调包2.获取数据1.简单入门2.XML返回值示例3.添加分类信息,获取最新论文4.
ArXiv
诸神缄默不语
·
2025-03-01 09:37
编程学习笔记
python
开发语言
ArXiv
API
XML
urllib
qwenvl 以及qwenvl 2 模型架构理解
github.com/QwenLM/Qwen2-VLtab=readme-ov-filehttps://qwenlm.github.io/zh/blog/qwen2-vl/论文:qwenvlhttps://
arxiv
.org
m0_74823239
·
2025-02-28 12:09
面试
学习路线
阿里巴巴
android
前端
后端
51-29 CVPR 2024 | BEV-Planner:开环端到端自动驾驶中自车状态是你所需要的一切吗?
论文链接:https://
arxiv
.org/abs/2312.03031.代码链接:ht
深圳季连AIgraphX
·
2025-02-28 07:51
aiXpilot
智驾大模型1
自动驾驶
人工智能
机器学习
智慧城市
计算机视觉
AIGC
文章精读篇——用于遥感小样本语义分割的可学习Prompt
题目:LearnablePromptforFew-ShotSemanticSegmentationinRemoteSensingDomain会议:CVPR2024Workshop论文:10.48550/
arXiv
LiXiang like coding吗
·
2025-02-28 04:59
学习
prompt
人工智能
【Reasoning】o1复现整合
调研文章《Marco-o1:TowardsOpenReasoningModelsforOpen-EndedSolutions》
arxiv
:https://
arxiv
.org/abs/2411.14405github
辰阳星宇
·
2025-02-27 23:49
科研论文
自然语言处理
语言模型
深度学习
人工智能
AI推介-多模态视觉语言模型VLMs论文速览(
arXiv
方向):2024.07.20-2024.07.25
文章目录~1.LPGen:EnhancingHigh-FidelityLandscapePaintingGenerationthroughDiffusionModel2.HighEfficiencyImageCompressionforLargeVisual-LanguageModels3.Q-Ground:ImageQualityGroundingwithLargeMulti-modalityM
小小帅AIGC
·
2025-02-26 21:19
VLM论文时报
人工智能
语言模型
自然语言处理
大语言模型
VLM
视觉语言模型
论文推送
ThinkJSON:通过强化学习让大型语言模型(LLM)严格遵守JSON模式
ReinforcementStrategyforStrictLLMSchemaAdherence作者:BhavikAgarwal,IshanJoshi,ViktoriaRojkova机构:MasterControlAIResearch链接:
arXiv
AI仙人掌
·
2025-02-26 20:17
人工智能
深度学习
AI生成内容带来的核心挑战引发人机共治的必要提前
语音导致金融市场波动医疗领域已出现AI生成的伪科学内容,某健康论坛中23%的"患者经验分享"被证实为AI虚构数据质量劣化Google索引数据显示,2023年新网页中38%为AI生成,其中重复率高达57%学术领域发现,
arXiv
临水逸
·
2025-02-25 05:08
人工智能
数字人|通过语音和图片来创建高质量的视频
简介
arXiv
上的计算机视觉领域论文:AniPortrait:Audio-DrivenSynthesisofPhotorealisticPortraitAnimationAniPortrait:照片级真实感肖像动画的音频驱动合成核心内容围绕一种新的人像动画合成框架展开
产品媛Gloria Deng
·
2025-02-24 07:57
AI之眼
音视频
数字人
talking
head
AniPortrait框架
AI
MuseTalk:利用潜在空间进行高质量实时唇形同步
论文题目:MuseTalk:Real-TimeHighQualityLipSynchronizationwithLatentSpaceInpainting论文链接:https://
arxiv
.org/abs
楠哥聊AI
·
2025-02-23 23:36
计算机视觉
数字人
talking
head
talking
face
3d
End-to-End Object Detection with Transformers
End-to-EndObjectDetectionwithTransformers会议:2020ECCV论文:https://
arxiv
.org/abs/2005.12872代码:https://github.com
M1kk0
·
2025-02-23 18:28
目标检测
计算机视觉
神经网络
LLM论文笔记 15: Transformers Can Achieve Length Generalization But Not Robustly
Arxiv
日期:2024.2.14机构:GoogleDeepMind/UniversityofToronto关键词长度泛化位置编码数据格式核心结论1.实验结论:十进制加法任务上的长度泛化最佳组合:FIRE
Zhouqi_Hua
·
2025-02-23 14:30
大模型论文阅读
论文阅读
语言模型
自然语言处理
深度学习
笔记
计算机视觉CV学习路线
mooc学习、计算机图形学)3.经典计算机视觉算法(可参考吴恩达机器学习课程、国内外计算机图形学课程)4.深度学习基础(参考吴恩达和TF、Keras官网手册)5.深度学习在计算机视觉中的应用(李飞飞课程、
arxiv
我喝AD钙
·
2025-02-22 23:08
我的学习笔记
计算机视觉
学习
人工智能
2023-
arXiv
-FinGPT: 开源金融大语言模型
arXiv
|https://
arxiv
.org/abs/2306.06031GitHub|https://github.com/AI4Finance-Foundation/FinGPT&https://
量仔搞靓化
·
2025-02-22 12:41
金融大语言模型
金融
语言模型
人工智能
谷歌:缓存增强优化冻结LLM的推理性能
标题:DeliberationinLatentSpaceviaDifferentiableCacheAugmentation来源:
arXiv
,2412.17747摘要通过生成和处理中间推理步骤,使大型语言模型
大模型任我行
·
2025-02-21 14:22
大模型-推理优化
人工智能
自然语言处理
语言模型
论文笔记
LLM论文笔记 14: The Impact of Positional Encoding on Length Generalization in Transformers
Arxiv
日期:2023.12.15机构:McGillUniversity/IBM/Facebook/ServiceNow关键词长度泛化位置编码CoT核心结论1.decoder-only中不显式使用位置编码
Zhouqi_Hua
·
2025-02-20 07:15
大模型论文阅读
论文阅读
人工智能
深度学习
笔记
语言模型
arXiv
每日推荐-3.4:语音/音频每日论文速递
同步公众号(
arXiv
每日学术速递)【1】SELD-TCN:SoundEventLocalization&DetectionviaTemporalConvolutionalNetworks标题:SELD-TCN
sapienst
·
2025-02-19 09:16
语音识别
语音识别
LLM论文笔记 9: Neural Networks and the Chomsky Hierarchy
Arxiv
日期:2022.9.29机构:GoogleDeepMind/Stanford关键词transformer架构原理乔姆斯基体系长度泛化核心结论1.虽然Transformer理论上具有图灵完备性,
Zhouqi_Hua
·
2025-02-19 02:47
大模型论文阅读
论文阅读
人工智能
深度学习
笔记
语言模型
揭密 scaling laws
论文题目:UnravelingtheMysteryofScalingLaws:PartI论文地址:https://
arxiv
.org/abs/240
deardao
·
2025-02-19 00:23
机器学习
CVPR‘24 | 百度开源DETRs在实时目标检测中胜过YOLOs
文末附行业细分群论文题目:DETRsBeatYOLOsonReal-timeObjectDetection作者:WenyuLv,YianZhao等作者机构:BaiduInc.论文链接:https://
arxiv
.org
3D视觉工坊
·
2025-02-18 19:01
3D视觉从入门到精通
百度
目标检测
人工智能
计算机视觉
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他