E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
端到端多模态推理
垂类大模型微调(二):使用LLaMA-Factory
上一篇博文和大家一起安装了LLaMA-Factory工具,并下载了大模型在上面进行了简单的加载和
推理
,今天尝试通过LoRa技术对大模型进行微调;一、训练集准备1.1介绍训练集结构这里演示对Qwen2.5
CITY_OF_MO_GY
·
2025-02-24 07:00
从零到亿大模型微调
llama
Yolov8-pose:从零开始训练Yolov8关键点检测模型
一、关键点检测模型
推理
1.拉取yolov8源码#克隆官方源代码gitclonehttps://gitee.com/monkeycc/ultralytics.gitcd.
CITY_OF_MO_GY
·
2025-02-24 07:00
YOLO
深度学习
人工智能
什么是AGI
与当前主流的**狭义人工智能(NarrowAI)**不同,AGI能够像人类一样灵活地处理各种任务,具备学习、
推理
、规划、创造和解决复杂问题的能力。
hunter206206
·
2025-02-24 06:23
人工智能
agi
覆盖从供应、生产、销售到运营的全过程,引领行业数智化转型新方向的智慧快消开源了
基于多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和
推理
框架、基础模型库、
端到端
开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基
AI服务老曹
·
2025-02-24 04:39
开源
人工智能
自动化
音视频
能源
金融大模型应用的机遇与挑战
大模型也在从单一自然语言处理模态向语音、图像等
多模态
大模型演进。目前国内外推出了众多的大模型,国内就不下上百款,也因此被称为“百模大战”或“千模大战”。
Python程序员罗宾
·
2025-02-24 03:34
金融
人工智能
语言模型
数据库
自然语言处理
DeepSeek学习教程 从入门到精通pdf下载:快速上手 DeepSeek
https://pan.baidu.com/s/1Ym0-_x9CrFHFld9UiOdA5A提取码:2ebc一、DeepSeek简介DeepSeek是一款由中国团队开发的高性能大语言模型,具备强大的
推理
能力和对中文的深刻理解
不会编程的程序猿ᅟ
·
2025-02-24 01:19
学习
DeepSeek模型量化
技术背景大语言模型(LargeLanguageModel,LLM),可以通过量化(Quantization)操作来节约内存/显存的使用,并且降低了通讯开销,进而达到加速模型
推理
的效果。
快乐非自愿
·
2025-02-23 22:29
deepseek
YOLOv8与DAttention机制的融合:复杂场景下目标检测性能的增强
注意力机制概述2.1DAttention机制的工作原理3.YOLOv8与DAttention(DAT)的结合3.1引入DAT的动机3.2集成方法3.3代码实现4.实验与结果分析4.1实验设置4.2结果分析
推理
速度性能对比
向哆哆
·
2025-02-23 21:22
YOLO
目标检测
目标跟踪
yolov8
目前(2025年2月)计算机视觉(CV)领域一些表现优异的深度学习模型
PaLI:这是一个
多模态
模型,结合了40亿参数的视觉Transformer(ViT)和多种大型语言模型(LLM),并在包含100多种语言的100亿图像和文本数据集上进行训练。PaLI在图像描述、视
空空转念
·
2025-02-23 20:18
深度学习系列
计算机视觉
深度学习
人工智能
DeepSeek:中国深度
推理
大模型的“全民化”浪潮——从互联网巨头到民生政务,一场AI生态的深度革命
2025年,中国人工智能领域迎来了一场由国产大模型DeepSeek引领的深度
推理
革命。
涛涛讲AI
·
2025-02-23 19:39
大模型
政务
人工智能
deepseek
大模型
云计算
达坦科技率先落地基于海光的DeepSeek一体机
达坦科技通过软硬件深度融合的方式,提供AI
推理
引擎和高性能网络,为AI应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对AI+Cloud的需求。
·
2025-02-23 16:33
【论文精读】MapTR:用于在线矢量化高精地图构建的结构化建模与学习
本文提出了MapTR,一种用于高效在线矢量化高精地图构建的结构化
端到端
Transformer模
青衫弦语
·
2025-02-23 14:02
自动驾驶
人工智能
深度学习
transformer
Xmodel-VLM: A Simple Baseline for Multimodal Vision Language Model
XmodelVLM:一种
多模态
视觉语言模型的简单基线摘要1引言2相关工作3模型架构4实验5消融研究6结论摘要我们介绍了XmodelVLM,一种前沿的
多模态
视觉语言模型。
UnknownBody
·
2025-02-23 14:58
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
RK3588 Linux板端
推理
时报错Segmentation fault解决办法
目录问题解决生成core文件修改core文件存储路径Ubuntu20.04下的异常状况利用core文件进行调试问题最近在使用rk3588跑官方提供的yolov5模型demo,能够完成单张图片的目标检测,但是在运行视频流demo时,系统报错:segmentationfault(coredumped)此时没有再给出更多的报错信息,不太好debug,在网上阅读了一些博客现在整理一下。解决在Linux下遇
kennyooooo
·
2025-02-23 12:48
linux
目标检测
yolo
嵌入式硬件
DeepSeek引爆递归开发大爆炸!
DeepSeekR1的发布意味着AI的普及是必然的,因为它让人们能轻松创建新的
推理
数据集,并用这些数据训练强大的AI模型。
极道Jdon
·
2025-02-23 12:47
javascript
reactjs
骁龙 8 至尊版:AI 手机的变革先锋
目录引言性能跃升:AI手机的强劲根基(一)CPU性能革命(二)GPU图形进化(三)NPU智能核心AI体验革新:多维度的智能进化(一)个性化
多模态
AI助手(二)影像体验的AI重塑(三)游戏体验的AI赋能生态合作与未来展望引言在当今科技飞速发展的时代
倔强的小石头_
·
2025-02-23 12:44
人工智能
大数据
边缘计算与联邦学习驱动医疗影像特征工程优化
内容概要随着医疗影像数据规模的指数级增长与
多模态
成像技术的普及,传统集中式特征工程方法面临数据孤岛、隐私泄露及计算效率等多重挑战。
智能计算研究中心
·
2025-02-23 11:40
其他
动态记忆网络 DeepMind的MEMO架构允许在
推理
时动态读写记忆矩阵,记忆容量提升40倍
传统的记忆网络通常只有一个外部记忆模块,而MEMO架构则引入了多层记忆模块,每一层记忆模块都以前一层记忆模块的输出作为输入,从而实现更复杂的记忆和
推理
。
玩人工智能的辣条哥
·
2025-02-23 09:24
人工智能
人工智能
【
多模态
处理篇二】【深度揭秘:DeepSeek视频理解之时空注意力机制解析】
一、为啥要搞视频理解这事儿咱先唠唠为啥视频理解这么重要哈。现在这互联网时代,视频那可是铺天盖地的。你刷短视频平台,看在线电影,玩游戏直播,到处都是视频。但是计算机它一开始可不懂视频里到底是啥意思,它看到的就是一堆像素点和声音信号。视频理解呢,就是要让计算机像人一样,能看懂视频里的内容。比如说,知道视频里是谁在干啥,发生了啥事儿,啥时候发生的。这在很多领域都特别有用,像安防监控,能自动识别视频里的异
再见孙悟空_
·
2025-02-23 07:40
「2025
DeepSeek技术全景实战」
音视频
自动化
DeepSeek
DeepSeek
R1
人工智能
机器学习
视频理解
【大模型】DeepSeek 高级提示词技巧使用详解
**明确目标**-**避免模糊性**:直接说明任务类型(如生成、分析、
推理
、创作)和期望的输出格式(如代码、列表、JSON、自然语言)。-**示例**:❌模糊提示:“帮我处理数据。”
大富大贵7
·
2025-02-23 06:01
程序员知识储备1
经验分享
DEMF模型赋能
多模态
图像融合,助力肺癌高效分类
因此,如何将
多模态
影像数据有机融合,以提升诊断效能,已成为
cv君
·
2025-02-23 06:59
cv君独家视角
AI内幕系列
深度学习
PET-CT
集成分类
肺部图像
多模态图像融合
deepseek-r1系列模型私有化部署分别需要的最低硬件配置
系列模型部署所需的最低硬件配置如下:DeepSeek-R1-1.5BCPU:最低4核(推荐多核处理器)内存:8GB+硬盘:3GB+存储空间(模型文件约1.5-2GB)显卡:非必需(纯CPU
推理
Sophie'sCookingLab
·
2025-02-23 05:21
大模型
deepseek
多模态
论文笔记——DiT(Diffusion Transformer)
大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍Transformer架构图像生成方面的应用,将Diffusion和Transformer结合起来的模型:DiT。目前DiT已经成为了AIGC时代的新宠儿,视频和图像生成不可缺少的一部分。文章目录论文定义架构与传统(U-Net)扩散模型区别架构噪声调度策略与传统扩散的相同输入图像/条件信息的Patch化(Pat
好评笔记
·
2025-02-23 04:19
多模态论文笔记
深度学习
transformer
DiT
人工智能
机器学习
aigc
stable
diffusion
DeepSeek爆火全网!清华团队104页教程+1000个神级提示词,手把手教你玩转AI神器
AI神器正文:一、DeepSeek最新动态:开源革命与政务应用双突破开源计划引爆开发者圈DeepSeek官方宣布将于下周启动“OpenSourceWeek”,开源5个核心代码库,涵盖在线服务基础组件、
推理
模型部署框架等关键技术
·
2025-02-23 04:53
后端
深度测评!国内四大云厂商 Deepseek API 谁最强?答案出人意料!
1.背景2025年1月20日左右,Deepseek推出了性能比肩OpenAIO1的DeepseekR1
推理
大模型,成功在国际市场出圈,实现“出口转内销”。
surfirst
·
2025-02-23 01:57
LLM
人工智能
Cline
Deepseek
DeepSeek核心技术 MoE(混合专家模型)
在DeepSeek-V2的基础上,采用MLA(多头潜在注意力)和DeepSeekMoE进行高效的
推理
和经济的训练。
baiyi666_888
·
2025-02-23 01:22
ai
QT开发技术 [opencv加载onnx模型,dnn
推理
]
一、导出onnx模型yoloexportmodel=xx\xx\best.ptformat=onnx二、qt加载onnx模型,
推理
显示std::stringfileName=QCoreApplication
增援未来章北海
·
2025-02-22 23:09
QT开发技术
qt
opencv
dnn
DeepSeek新作-Native Sparse Attention
这意味着模型需要能够处理和理解长篇幅的文本内容,例如长篇文章、书籍、复杂的对话等,这对于语言模型的
推理
、生成和理解能力提出了更高的要求。
数据分析能量站
·
2025-02-22 21:21
机器学习
人工智能
探索火山引擎 DeepSeek-R1:高速低延迟AI解决方案引领未来
DeepSeek-R1满血版推荐火山引擎DeepSeek-R1特性总结前言方舟大模型体验中心全新上线,免登录体验满血+联网版DeepSeekR1模型及豆包最新版模型点击登录登录后免费赠送每个模型50万tokens
推理
额度
熬夜磕代码丶
·
2025-02-22 18:25
经验之谈
火山引擎
人工智能
LLM之提示词工程
研究人员借助提示工程,致力于增强LLM在广泛且复杂的任务(如问答系统与算术
推理
)中的表现。而对于开发人员而言,提示工程则成为设计高效、强大提示技术的关键,这些技术能够无缝对接LLM与其他工具,实现功
樱花的浪漫
·
2025-02-22 16:11
大模型与智能体
人工智能
自然语言处理
知识图谱
神经网络
agent
大模型
Python:实现 PyTorch 中训练自定义卷积神经网络模型(CNN)并导出模型为 ONNX 格式,同时使用 ONNX Runtime 进行
推理
本文将介绍如何使用PyTorch训练一个简单的卷积神经网络(CNN)模型,并将训练好的模型导出为ONNX格式,之后使用ONNXRuntime在Python中加载并进行
推理
。
煤炭里de黑猫
·
2025-02-22 16:40
python
pytorch
cnn
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step
LLaVACoT:让视觉语言模型逐步
推理
摘要1引言2相关工作3提出的方法4后训练性能5
推理
时间缩放6最新VLMs的比较7结论摘要大型语言模型在
推理
能力方面取得了长足的进步,特别是通过
推理
时间缩放,如OpenAI
UnknownBody
·
2025-02-22 16:08
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
什么是CoT(带有长链思维)的Few-shot Prompting(少样本提示)
使用**带有长链思维(Chain-of-Thought,CoT)的少样本提示(Few-shotPrompting)**是一种强大的技术,能够帮助模型更好地解决复杂问题,尤其是需要多步
推理
的任务。
早退的程序员
·
2025-02-22 15:03
人工智能
大语言模型基础
AI大模型主要分为三类:大语言模型、CV大模型和
多模态
大模型,我将分别介绍它们的背景知识、关键技术、演进路线和挑战。什么是大语言模型大语言模型(LargeLanguageModel,LL
MatrixSparse
·
2025-02-22 15:27
大模型
人工智能
语言模型
自然语言处理
人工智能
RepVGGBlock实现
这种方法可以在训练时使用复杂的多分支结构,在
推理
时将其简化为单一的卷积层,从而显著提高
武乐乐~
·
2025-02-22 13:45
论文复现
算法
深度学习
【有啥问啥】DeepSeek NSA(Native Sparse Attention):开启高效
推理
与降本增效的新篇章
DeepSeekNSA(NativeSparseAttention):开启高效
推理
与降本增效的新篇章在人工智能领域,尤其是自然语言处理(NLP)和大语言模型(LLM)的浪潮中,性能与效率一直是研究者和开发者关注的焦点
有啥问啥
·
2025-02-22 09:46
大模型
人工智能
算法
DeepSeek 学习路线图
概率统计:理解贝叶斯理论和概率分布,用于模型训练和
推理
。微积分:了解优化算法中的梯度下降等概念。2.编程基础Python:掌握Python编程,这是深度学习和AI开发的主要语言
CarlowZJ
·
2025-02-22 09:14
学习
deepseek
微构科技《VigorData一站式企业大数据平台产品白皮书》
01产品概述1.1.产品目标一站式企业大数据平台VigorData提供了
端到端
一站式数据处理服务,
皙姑娘
·
2025-02-22 07:00
微构大数据
微构科技
微构大数据
VigorData
一站式企业大数据平台
产品白皮书
《机器学习实战》专栏 No12:项目实战—
端到端
的机器学习项目Kaggle糖尿病预测
《机器学习实战》专栏第12集:项目实战——
端到端
的机器学习项目Kaggle糖尿病预测本集为专栏最后一集,本专栏的特点是短平快,聚焦重点,不长篇大论纠缠于理论,而是在介绍基础理论框架基础上,快速切入实战项目和代码
带娃的IT创业者
·
2025-02-22 07:59
机器学习实战
机器学习
人工智能
分类
算法
python
YOLOv11快速上手:如何在本地使用TorchServe部署目标检测模型
本文将详细介绍如何使用YOLOv11训练你的第一个目标检测模型,并通过TorchServe在本地进行部署,实现模型的快速
推理
。
SYC_MORE
·
2025-02-22 07:57
YOLOv11
系列教程:模型训练
优化与部署全攻略
TorchServe
YOLOv11教程
模型部署与推理
TorchServe应用
目标检测模型训练
YOLO模型导出
推理
模型时代:大语言模型如何从对话走向深度思考?
一、对话模型和
推理
模型的区别概述对话模型是专门用于问答交互的语言模型,符合人类的聊天方式,返回的内容可能仅仅只是一个简短的答案,一般模型名称后面会带有「chat」字样。
深度学习机器
·
2025-02-22 07:56
优质项目
RAG
大语言模型
语言模型
人工智能
开源
DeepSeek的架构设计
A100等),通过自研RDMA网络实现μs级延迟能效优化:采用液冷+余热回收技术,PUE<1.1,算力密度达50kW/机柜故障自愈:基于强化学习的节点健康预测系统,实现硬件故障30秒内隔离2.数据工场体系
多模态
处理管道
程序猿000001号
·
2025-02-22 06:24
DeepSeek
架构设计
SD模型微调之LoRA
本文是SD模型微调方法LoRA的详细介绍,包括数据集准备,模型微调过程,
推理
过程,优缺点等。
好评笔记
·
2025-02-22 06:22
补档
深度学习
计算机视觉
人工智能
面试
AIGC
SD
stable
diffusion
大模型量化概述
近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,从而导致模型变得越来越大,因此,我们需要一些大模型压缩技术来降低模型部署的成本,并提升模型的
推理
性能。
AI领航者
·
2025-02-22 04:02
人工智能
ai
大模型
超级详细,知识图谱系统的理论详解+部署过程
知识图谱系统(KnowledgeGraphSystem)是一种用于表示、存储、查询和
推理
知识的系统。
mosquito_lover1
·
2025-02-22 01:34
python
开发语言
知识图谱
马斯克发布的Grok3如何,大家如何评价
这种大规模的计算资源投入使得Grok3在
推理
能力和逻辑一致性方面表现出色。
多模态
与实时数据处
魔王阿卡纳兹
·
2025-02-22 01:30
大模型知识札记
Grok3
大模型
AI
马斯克
xAI
告别 AI 幻觉:LangChain + 知识图谱 + 大模型,打造可靠的智能应用
项目准备:环境配置与工具选择手把手实现5.1从文本中提取结构化知识存入图谱6.2基于LangChain知识图谱的查询与
推理
实践Tips:如何让知识图谱规模化、应用化?
海棠AI实验室
·
2025-02-22 00:20
AI
Agent学习进阶实战
人工智能
langchain
知识图谱
Agent
DeepSeek最新论文:原生稀疏注意力
论文大致内容如下:长文本建模的重要性在深度
推理
、代码生成和多轮对话等应用中,长文本建模显得尤为重要。然而,随着文本长度的增加,传统的注意力机制计算复杂度急剧上升,导致处理速度变慢,无
大模型老炮
·
2025-02-22 00:18
人工智能
Deepseek
学习
大模型
职场和发展
AI大模型
大模型学习
有哪些好用的AI工具?(你想要的AI工具都在这)
1.常见应用场景1.1.国内通用大模型模型名称简介官网地址DeepSeek深度求索公司研发的高性能开源模型,以低成本、高
推理
能力著称,支持数学、代码等复杂任务。
·
2025-02-21 23:25
c++
AI 模型的优化与应用:大模型本体、蒸馏、量化 与 GGUF
引言近年来,大型语言模型(LLM)在人工智能领域取得了突破性的进展,但其计算需求高昂,训练和
推理
成本巨大。因此,如何优化大模型,使其在不同设备和应用场景下更高效地运行,成为了AI研究的重要课题。
CCSBRIDGE
·
2025-02-21 23:15
人工智能
人工智能
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他