端到端多模态推理第8页

垂类大模型微调（二）：使用LLaMA-Factory

上一篇博文和大家一起安装了LLaMA-Factory工具，并下载了大模型在上面进行了简单的加载和推理，今天尝试通过LoRa技术对大模型进行微调；一、训练集准备1.1介绍训练集结构这里演示对Qwen2.5

CITY_OF_MO_GY·2025-02-24 07:00

Yolov8-pose：从零开始训练Yolov8关键点检测模型

一、关键点检测模型推理1.拉取yolov8源码#克隆官方源代码gitclonehttps://gitee.com/monkeycc/ultralytics.gitcd.

CITY_OF_MO_GY·2025-02-24 07:00

什么是AGI

与当前主流的**狭义人工智能（NarrowAI）**不同，AGI能够像人类一样灵活地处理各种任务，具备学习、推理、规划、创造和解决复杂问题的能力。

hunter206206·2025-02-24 06:23

覆盖从供应、生产、销售到运营的全过程，引领行业数智化转型新方向的智慧快消开源了

基于多年的深度学习技术研究和业务应用为基础，集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体，是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基

AI服务老曹·2025-02-24 04:39

金融大模型应用的机遇与挑战

大模型也在从单一自然语言处理模态向语音、图像等多模态大模型演进。目前国内外推出了众多的大模型，国内就不下上百款，也因此被称为“百模大战”或“千模大战”。

Python程序员罗宾·2025-02-24 03:34

DeepSeek学习教程从入门到精通pdf下载：快速上手 DeepSeek

https://pan.baidu.com/s/1Ym0-_x9CrFHFld9UiOdA5A提取码:2ebc一、DeepSeek简介DeepSeek是一款由中国团队开发的高性能大语言模型，具备强大的推理能力和对中文的深刻理解

不会编程的程序猿ᅟ·2025-02-24 01:19

DeepSeek模型量化

技术背景大语言模型（LargeLanguageModel，LLM），可以通过量化（Quantization）操作来节约内存/显存的使用，并且降低了通讯开销，进而达到加速模型推理的效果。

快乐非自愿·2025-02-23 22:29

YOLOv8与DAttention机制的融合：复杂场景下目标检测性能的增强

注意力机制概述2.1DAttention机制的工作原理3.YOLOv8与DAttention(DAT)的结合3.1引入DAT的动机3.2集成方法3.3代码实现4.实验与结果分析4.1实验设置4.2结果分析推理速度性能对比

向哆哆·2025-02-23 21:22

目前（2025年2月）计算机视觉（CV）领域一些表现优异的深度学习模型

PaLI：这是一个多模态模型，结合了40亿参数的视觉Transformer（ViT）和多种大型语言模型（LLM），并在包含100多种语言的100亿图像和文本数据集上进行训练。PaLI在图像描述、视

空空转念·2025-02-23 20:18

DeepSeek：中国深度推理大模型的“全民化”浪潮——从互联网巨头到民生政务，一场AI生态的深度革命

2025年，中国人工智能领域迎来了一场由国产大模型DeepSeek引领的深度推理革命。

涛涛讲AI·2025-02-23 19:39

达坦科技率先落地基于海光的DeepSeek一体机

达坦科技通过软硬件深度融合的方式，提供AI推理引擎和高性能网络，为AI应用提供弹性、便利、经济的基础设施服务，以此满足不同行业客户对AI+Cloud的需求。

·2025-02-23 16:33

【论文精读】MapTR：用于在线矢量化高精地图构建的结构化建模与学习

本文提出了MapTR，一种用于高效在线矢量化高精地图构建的结构化端到端Transformer模

青衫弦语·2025-02-23 14:02

Xmodel-VLM: A Simple Baseline for Multimodal Vision Language Model

XmodelVLM：一种多模态视觉语言模型的简单基线摘要1引言2相关工作3模型架构4实验5消融研究6结论摘要我们介绍了XmodelVLM，一种前沿的多模态视觉语言模型。

UnknownBody·2025-02-23 14:58

RK3588 Linux板端推理时报错Segmentation fault解决办法

目录问题解决生成core文件修改core文件存储路径Ubuntu20.04下的异常状况利用core文件进行调试问题最近在使用rk3588跑官方提供的yolov5模型demo，能够完成单张图片的目标检测，但是在运行视频流demo时，系统报错：segmentationfault(coredumped)此时没有再给出更多的报错信息，不太好debug，在网上阅读了一些博客现在整理一下。解决在Linux下遇

kennyooooo·2025-02-23 12:48

DeepSeek引爆递归开发大爆炸！

DeepSeekR1的发布意味着AI的普及是必然的，因为它让人们能轻松创建新的推理数据集，并用这些数据训练强大的AI模型。

极道Jdon·2025-02-23 12:47

骁龙 8 至尊版：AI 手机的变革先锋

目录引言性能跃升：AI手机的强劲根基（一）CPU性能革命（二）GPU图形进化（三）NPU智能核心AI体验革新：多维度的智能进化（一）个性化多模态AI助手（二）影像体验的AI重塑（三）游戏体验的AI赋能生态合作与未来展望引言在当今科技飞速发展的时代

倔强的小石头_·2025-02-23 12:44

边缘计算与联邦学习驱动医疗影像特征工程优化

内容概要随着医疗影像数据规模的指数级增长与多模态成像技术的普及，传统集中式特征工程方法面临数据孤岛、隐私泄露及计算效率等多重挑战。

智能计算研究中心·2025-02-23 11:40

动态记忆网络 DeepMind的MEMO架构允许在推理时动态读写记忆矩阵，记忆容量提升40倍

传统的记忆网络通常只有一个外部记忆模块，而MEMO架构则引入了多层记忆模块，每一层记忆模块都以前一层记忆模块的输出作为输入，从而实现更复杂的记忆和推理。

玩人工智能的辣条哥·2025-02-23 09:24

【多模态处理篇二】【深度揭秘：DeepSeek视频理解之时空注意力机制解析】

一、为啥要搞视频理解这事儿咱先唠唠为啥视频理解这么重要哈。现在这互联网时代，视频那可是铺天盖地的。你刷短视频平台，看在线电影，玩游戏直播，到处都是视频。但是计算机它一开始可不懂视频里到底是啥意思，它看到的就是一堆像素点和声音信号。视频理解呢，就是要让计算机像人一样，能看懂视频里的内容。比如说，知道视频里是谁在干啥，发生了啥事儿，啥时候发生的。这在很多领域都特别有用，像安防监控，能自动识别视频里的异

再见孙悟空_·2025-02-23 07:40

【大模型】DeepSeek 高级提示词技巧使用详解

**明确目标**-**避免模糊性**：直接说明任务类型（如生成、分析、推理、创作）和期望的输出格式（如代码、列表、JSON、自然语言）。-**示例**：❌模糊提示：“帮我处理数据。”

大富大贵7·2025-02-23 06:01

DEMF模型赋能多模态图像融合，助力肺癌高效分类

因此，如何将多模态影像数据有机融合，以提升诊断效能，已成为

cv君·2025-02-23 06:59

deepseek-r1系列模型私有化部署分别需要的最低硬件配置

系列模型部署所需的最低硬件配置如下‌：‌DeepSeek-R1-1.5B‌‌CPU‌：最低4核（推荐多核处理器）‌内存‌：8GB+‌硬盘‌：3GB+存储空间（模型文件约1.5-2GB）‌显卡‌：非必需（纯CPU推理

Sophie'sCookingLab·2025-02-23 05:21

多模态论文笔记——DiT（Diffusion Transformer）

大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Transformer架构图像生成方面的应用，将Diffusion和Transformer结合起来的模型：DiT。目前DiT已经成为了AIGC时代的新宠儿，视频和图像生成不可缺少的一部分。文章目录论文定义架构与传统(U-Net)扩散模型区别架构噪声调度策略与传统扩散的相同输入图像/条件信息的Patch化（Pat

好评笔记·2025-02-23 04:19

DeepSeek爆火全网！清华团队104页教程+1000个神级提示词，手把手教你玩转AI神器

·2025-02-23 04:53

深度测评！国内四大云厂商 Deepseek API 谁最强？答案出人意料！

1.背景2025年1月20日左右，Deepseek推出了性能比肩OpenAIO1的DeepseekR1推理大模型，成功在国际市场出圈，实现“出口转内销”。

surfirst·2025-02-23 01:57

DeepSeek核心技术 MoE（混合专家模型）

在DeepSeek-V2的基础上，采用MLA（多头潜在注意力）和DeepSeekMoE进行高效的推理和经济的训练。

baiyi666_888·2025-02-23 01:22

QT开发技术 [opencv加载onnx模型，dnn推理]

一、导出onnx模型yoloexportmodel=xx\xx\best.ptformat=onnx二、qt加载onnx模型，推理显示std::stringfileName=QCoreApplication

增援未来章北海·2025-02-22 23:09

DeepSeek新作-Native Sparse Attention

这意味着模型需要能够处理和理解长篇幅的文本内容，例如长篇文章、书籍、复杂的对话等，这对于语言模型的推理、生成和理解能力提出了更高的要求。

数据分析能量站·2025-02-22 21:21

探索火山引擎 DeepSeek-R1：高速低延迟AI解决方案引领未来

熬夜磕代码丶·2025-02-22 18:25

LLM之提示词工程

研究人员借助提示工程，致力于增强LLM在广泛且复杂的任务（如问答系统与算术推理）中的表现。而对于开发人员而言，提示工程则成为设计高效、强大提示技术的关键，这些技术能够无缝对接LLM与其他工具，实现功

樱花的浪漫·2025-02-22 16:11

Python：实现 PyTorch 中训练自定义卷积神经网络模型(CNN)并导出模型为 ONNX 格式，同时使用 ONNX Runtime 进行推理

本文将介绍如何使用PyTorch训练一个简单的卷积神经网络（CNN）模型，并将训练好的模型导出为ONNX格式，之后使用ONNXRuntime在Python中加载并进行推理。

煤炭里de黑猫·2025-02-22 16:40

LLaVA-CoT: Let Vision Language Models Reason Step-by-Step

LLaVACoT：让视觉语言模型逐步推理摘要1引言2相关工作3提出的方法4后训练性能5推理时间缩放6最新VLMs的比较7结论摘要大型语言模型在推理能力方面取得了长足的进步，特别是通过推理时间缩放，如OpenAI

UnknownBody·2025-02-22 16:08

什么是CoT（带有长链思维）的Few-shot Prompting（少样本提示）

使用**带有长链思维（Chain-of-Thought,CoT）的少样本提示（Few-shotPrompting）**是一种强大的技术，能够帮助模型更好地解决复杂问题，尤其是需要多步推理的任务。

早退的程序员·2025-02-22 15:03

大语言模型基础

AI大模型主要分为三类：大语言模型、CV大模型和多模态大模型，我将分别介绍它们的背景知识、关键技术、演进路线和挑战。什么是大语言模型大语言模型（LargeLanguageModel，LL

MatrixSparse·2025-02-22 15:27

RepVGGBlock实现

这种方法可以在训练时使用复杂的多分支结构，在推理时将其简化为单一的卷积层，从而显著提高

武乐乐~·2025-02-22 13:45

【有啥问啥】DeepSeek NSA（Native Sparse Attention）：开启高效推理与降本增效的新篇章

DeepSeekNSA（NativeSparseAttention）：开启高效推理与降本增效的新篇章在人工智能领域，尤其是自然语言处理（NLP）和大语言模型（LLM）的浪潮中，性能与效率一直是研究者和开发者关注的焦点

有啥问啥·2025-02-22 09:46

DeepSeek 学习路线图

概率统计：理解贝叶斯理论和概率分布，用于模型训练和推理。微积分：了解优化算法中的梯度下降等概念。2.编程基础Python：掌握Python编程，这是深度学习和AI开发的主要语言

CarlowZJ·2025-02-22 09:14

微构科技《VigorData一站式企业大数据平台产品白皮书》

01产品概述1.1.产品目标一站式企业大数据平台VigorData提供了端到端一站式数据处理服务,

皙姑娘·2025-02-22 07:00

《机器学习实战》专栏 No12：项目实战—端到端的机器学习项目Kaggle糖尿病预测

《机器学习实战》专栏第12集：项目实战——端到端的机器学习项目Kaggle糖尿病预测本集为专栏最后一集，本专栏的特点是短平快，聚焦重点，不长篇大论纠缠于理论，而是在介绍基础理论框架基础上，快速切入实战项目和代码

带娃的IT创业者·2025-02-22 07:59

YOLOv11快速上手：如何在本地使用TorchServe部署目标检测模型

本文将详细介绍如何使用YOLOv11训练你的第一个目标检测模型，并通过TorchServe在本地进行部署，实现模型的快速推理。

SYC_MORE·2025-02-22 07:57

推理模型时代：大语言模型如何从对话走向深度思考？

一、对话模型和推理模型的区别概述对话模型是专门用于问答交互的语言模型，符合人类的聊天方式，返回的内容可能仅仅只是一个简短的答案，一般模型名称后面会带有「chat」字样。

深度学习机器·2025-02-22 07:56

DeepSeek的架构设计

A100等），通过自研RDMA网络实现μs级延迟能效优化:采用液冷+余热回收技术，PUE<1.1，算力密度达50kW/机柜故障自愈:基于强化学习的节点健康预测系统，实现硬件故障30秒内隔离2.数据工场体系多模态处理管道

程序猿000001号·2025-02-22 06:24

SD模型微调之LoRA

本文是SD模型微调方法LoRA的详细介绍，包括数据集准备，模型微调过程，推理过程，优缺点等。

好评笔记·2025-02-22 06:22

大模型量化概述

近年来，随着Transformer、MOE架构的提出，使得深度学习模型轻松突破上万亿规模参数，从而导致模型变得越来越大，因此，我们需要一些大模型压缩技术来降低模型部署的成本，并提升模型的推理性能。

AI领航者·2025-02-22 04:02

超级详细，知识图谱系统的理论详解+部署过程

知识图谱系统（KnowledgeGraphSystem）是一种用于表示、存储、查询和推理知识的系统。

mosquito_lover1·2025-02-22 01:34

马斯克发布的Grok3如何,大家如何评价

这种大规模的计算资源投入使得Grok3在推理能力和逻辑一致性方面表现出色。多模态与实时数据处

魔王阿卡纳兹·2025-02-22 01:30

告别 AI 幻觉：LangChain + 知识图谱 + 大模型，打造可靠的智能应用

项目准备：环境配置与工具选择手把手实现5.1从文本中提取结构化知识存入图谱6.2基于LangChain知识图谱的查询与推理实践Tips：如何让知识图谱规模化、应用化？

海棠AI实验室·2025-02-22 00:20

DeepSeek最新论文：原生稀疏注意力

论文大致内容如下：长文本建模的重要性在深度推理、代码生成和多轮对话等应用中，长文本建模显得尤为重要。然而，随着文本长度的增加，传统的注意力机制计算复杂度急剧上升，导致处理速度变慢，无

大模型老炮·2025-02-22 00:18

有哪些好用的AI工具？(你想要的AI工具都在这)

1.常见应用场景1.1.国内通用大模型模型名称简介官网地址DeepSeek深度求索公司研发的高性能开源模型，以低成本、高推理能力著称，支持数学、代码等复杂任务。

·2025-02-21 23:25

AI 模型的优化与应用：大模型本体、蒸馏、量化与 GGUF

引言近年来，大型语言模型（LLM）在人工智能领域取得了突破性的进展，但其计算需求高昂，训练和推理成本巨大。因此，如何优化大模型，使其在不同设备和应用场景下更高效地运行，成为了AI研究的重要课题。

CCSBRIDGE·2025-02-21 23:15

推荐频道

端到端多模态推理