推理第10页

auto-gptq安装以及不适配软硬件环境可能出现的问题及解决方式

.`（2）没有报错但是推理速度超级慢1、auto-gptq是什么？Auto-GPTQ是一种专注于量化深度学习模型的工具库。

IT修炼家·2025-02-20 12:00

知识图谱的作用及其更新方式

知识图谱的作用及其更新方式简介作用1.语义理解和推理2.信息检索3.推荐系统4.自然语言处理5.智能对话系统更新知识图谱的过程1.数据收集2.数据清洗和处理3.知识抽取4.知识融合5.验证和评估6.部署和应用总结简介知识图谱是一种以图形结构表示知识的方法

甜瓜瓜哥·2025-02-20 10:13

Python中LLM的知识图谱构建：动态更新与推理

文章目录引言1.知识图谱的基本概念1.1知识图谱的定义1.2知识图谱的构建流程2.利用LLM进行知识抽取2.1实体识别2.2关系抽取2.3属性抽取3.知识融合3.1实体对齐3.2冲突消解4.知识存储5.知识推理

二进制独立开发·2025-02-20 09:35

handpose_X 之 onnx runtime C++（手部关键点检测）

示例视频：开源项目-手势识别手势检测手部21关键点检测2、手部关键点检测onnx模型，onnxruntimeC++模型推理。项目地址：https://gitco

Xian-HHappy·2025-02-20 09:02

DeepSeek掀起推理服务器新风暴，AI应用迎来变革转折点？

AI浪潮下，推理服务器崭露头角在科技飞速发展的当下，AI是耀眼明星，席卷各行业，深刻改变生活与工作模式，从语音助手到医疗诊断、金融风险预测，AI无处不在。

小深ai硬件分享·2025-02-20 08:20

使用Yuan 2.0与LangChain构建智能聊天应用：完整指南

相比之前的Yuan1.0，Yuan2.0使用了更广泛的高质量预训练数据，并通过指令微调数据集增强了模型的语义理解、数学推理、编程知识等能力。

scaFHIO·2025-02-20 05:33

KTransformers如何通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度？

KTransformers通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度，具体体现在以下几个方面：内核级优化：KTransformers采用了高效的内核级优化技术，包括对

魔王阿卡纳兹·2025-02-20 04:53

使用LangChain与Clarifai模型进行交互

在现代AI应用开发中，Clarifai提供了一个完整的AI生命周期管理平台，包括数据探索、数据标注、模型训练、评估和推理。本文将探讨如何使用LangChain库与Clarifai的模型进行交互。

vaidfl·2025-02-20 02:06

百度百舸 DeepSeek 一体机发布，支持昆仑芯 P800 单机 8 卡满血版开箱即用

选择合适的GPU配置、安装相应的环境、成功部署上线业务、加速推理任务加速、支撑多用户并发……完成业务测试，成功融入生产业务中。

百度智能云技术站·2025-02-20 01:55

本地运行 DeepSeek-R1 的成本究竟多高？

但要在家里开这种“巨无霸”，可不是闹着玩的：光是推理就对硬件提出了非常高的要求。这篇文章将大致拆解一下，如果真想在个人电脑上运行DeepSeek-R1，可能需

·2025-02-20 00:52

PHIDATA智能体AGENT构建框架

利用记忆、知识、工具和推理构建代理。建立可以协同工作解决问题的代理团队。使用美观的AgentUI与您的代理和工作流程进行交互。

何为标准·2025-02-19 23:10

语音识别使用SenseVoiceSmall模型实现源码

本项目提供SenseVoice模型的介绍以及在多个任务测试集上的benchmark，以及体验模型所需的环境安装的与推理方式。

丢了个猪·2025-02-19 23:09

自然语言处理NLP 01语言转换&语言模型

FeatureExtraction）(1)词袋模型（BagofWords,BoW）(2)TF-IDF(3)词嵌入（WordEmbedding）3.模型输入（ModelInput）(1)序列编码(2)预训练模型输入4.模型推理

伊一大数据&人工智能学习日志·2025-02-19 22:56

DeepSeek底层揭秘——多跳推理

1.多跳推理(1)定义多跳推理（Multi-hopReasoning）是一种复杂的推理技术，指模型在回答问题或解决任务时，需要跨越多个信息片段或知识点，逐步推导出最终答案，而不是直接从单一信息源中获取结果

9命怪猫·2025-02-19 20:14

【深度学习入门：基于python的理论与实现读书笔记】第五章误差反向传播法

目录摘要第五章误差反向传播法简单层的实现乘法层的实现加法层的实现激活函数层的实现ReLU层Sigmoid层Affine层和Softmax层的实现Affine层Softmax-with-Loss层误差反向传播法的实现摘要该文章简要介绍了神经网络的误差反向传播法，省去了大量的推理过程

Bin二叉·2025-02-19 19:37

【大模型】量化、剪枝、蒸馏

大模型的量化、剪枝和蒸馏是三种常用的模型优化技术，旨在减少模型的复杂性，降低计算资源消耗，并加速推理过程。

油泼辣子多加·2025-02-19 18:02

YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化

YOLOv11算法对比：性能提升与优化前言一、YOLOv11算法概述二、训练步骤2.验证数据的数据代码2.改进版YOLOv11算法的创新a.改进的特征提取网络b.多通道特征融合机制c.自适应损失函数d.动态推理优化

m0_54717829·2025-02-19 16:17

DeepSeek-r1 与 RAG工作流的无缝结合：应对复杂问题的新方式

ByDeanSacoranskyandDenizAskin原文标题：推理与递归检索：Deepseek-r1、Tavily和LangGraphDeepSeek-r1的影响DeepSeek在不到一个月前公开发布了

·2025-02-19 15:28

（1-2）DeepSeek概述：DeepSeek的架构概览

1.2.1DeepSeek的整体架构设计DeepSeek的整体架构设计以高效处理长文本和提升推理

码农三叔·2025-02-19 15:59

deepseek从入门到精通（1）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、DeepSeek是什么二、DeepSeek可以做什么三、推理模型和通用模型四、提示语（一）什么是提示语（二）提示语策略差异

低空新兵·2025-02-19 14:22

从零开始部署DeepSeek：基于Ollama+Flask的本地化AI对话系统

从零开始部署DeepSeek：基于Ollama+Flask的本地化AI对话系统一、部署背景与工具选型在AI大模型遍地开花的2025年，DeepSeekR1凭借其出色的推理能力和开源特性成为开发者首选。

arbboter·2025-02-19 14:21

AI大模型对决：DeepSeek与Grok 3，谁才是真王者？

在数学任务的AIME'24数学能力测试中，Grok3取得了52分，而DeepSeek-V3仅获得39分，Grok3展现出更强的数学推理能力；在GPQA科学知识评估中，Grok3以75分领先于DeepSeek-V3

广拓科技·2025-02-19 12:07

DeepSeek与ChatGPT：AI语言模型的全面对决

技术路线与核心优势DeepSeek：算法创新与成本优化混合专家模型（MoE）与MLA技术：DeepSeek采用混合专家模型框架，通过动态选择专家模型处理复杂任务，结合多头潜在注意力机制（MLA），显著降低推理成本并提升效率

芯作者·2025-02-19 08:38

蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破

目录蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破一、蓝耘服务器的技术优势1、高性能计算能力2、可扩展性与高效存储3、绿色节能设计二、DeepSeek：智能算法的引擎1、高效的深度学习训练与推理

Lethehong·2025-02-19 08:36

微调alpaca-lora遇到的一些问题

目录一、环境简介二、混合精度训练Tensor相互计算会报错三、推理加载lora报错：SafetensorError:Errorwhiledeserializingheader:InvalidHeaderDeserialization

自学AI的鲨鱼儿·2025-02-19 05:42

DeepSeek多软件协同效应，产生的王炸组合

DeepSeek网址:DeepSeek|深度求索1.DeepSeek+Kimi：一键生成高质量PPT，快速制作专业演示文稿Kimi网址:Kimi.ai-会推理解析，能深度思考的AI助手步骤：将PPT内容描述给

Chhjnavy·2025-02-19 02:20

联想E470 双GPU笔记本部署私有AI模型方案

一、硬件适配优化方案显存限制突破使用4-bit量化技术压缩模型，例如加载ChatGLM3-6B的INT4版本，显存需求可降至6GB310启用CPU-GPU混合推理（通过

月光技术杂谈·2025-02-19 02:18

deepseek和ChatGPT 4o比较

DeepSeek和ChatGPT4o在实现方式、评测效果和使用体验方面的详细比较：实现方式：DeepSeek：推理型大模型DeepSeek的核心是推理型大模型，与指令型大模型不同，它不需要用户提供详细的步骤指令

调皮的芋头·2025-02-19 02:46

[论文笔记] Cost-Effective Hyperparameter Optimization for Large Language Model Generation 大型语言模型生成推理超参优化

成本效益高的大型语言模型生成推理的超参数优化https://openreview.net/pdf?

心心喵·2025-02-19 02:45

电力知识图谱与大模型的结合：从构建到行业应用的深度解析

而当知识图谱与大模型相结合，更能释放强大的知识推理和智能预测能力，为行业智慧化发展注入新动力。本文将从专业视角，深入探讨电力知识图谱的构建过程、大模型的融入方法，以及它们在实际应用中的落地场景。

Cc不爱吃洋葱·2025-02-19 02:44

采用分布式部署deepseek

分布式部署DeepSeek涉及使用多个计算节点来加速模型训练或提升推理效率。下面是一个基本的指南，帮助您了解如何进行分布式部署。

慧香一格·2025-02-19 02:14

知识图谱智能应用系统：数据存储架构与流程解析

知识图谱通过将数据转化为结构化的知识网络，不仅能够高效地存储和管理海量信息，还能通过复杂的查询和推理，为用户提供深度的知识洞察。

梦落青云·2025-02-19 02:43

《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章

无需网络连接的数据隐私保护跨平台架构设计：支持Windows/macOS/Linux全平台模型管理引擎：自动化处理模型依赖与版本控制1.2DeepSeek模型特性多模态处理能力：文本生成、代码理解、数学推理中文优化架构

Allen-Steven·2025-02-19 01:05

DeepSeek 实用集成,接入各类软件

详细内容参考：点我应用程序QuantalogicQuantaLogic是一个ReAct（推理和行动）框架，用于构建高级AI代理

安替-AnTi·2025-02-19 00:28

如何训练LLM“思考”（像o1和DeepSeek-R1一样, 高级推理模型解析

2024年9月，OpenAI发布了它的o1模型，该模型基于大规模强化学习训练，赋予了它“高级推理”能力。不幸的是，他们是如何做到这一点的细节从未被公开披露。

果冻人工智能·2025-02-18 22:06

DeepSeek 入门：在 MacOS 上本地运行 DeepSeek-R1

开源AI模型DeepSeek-R1在推理、编码和数学任务方面表现出色。DeepSeek-R1旨在提供准确、合乎逻辑的响应，是开发人员、研究人员或任何对AI感兴趣的人的理想选择。

知识大胖·2025-02-18 20:46

DeepSeek系列模型：高效能推理与多模态处理的技术突破与实践路径

目录引言一、高效能推理的核心技术路径二、多模态处理的技术创新三、技术协同与落地实践四、未来技术演进方向结论引言背景与挑战AI模型规模化趋势下，推理效率与多模态融合成为关键瓶颈。

张3蜂·2025-02-18 19:00

CSDN C知道接入DeepSeek-R1满血版，赋能开发者高效智能编程与问题解决

“CSDN积极整合行业顶尖技术能力，现已引入以DeepSeek为代表的推理大模型，并与C知道AI搜索产品深度融合，致力于为开发者提供更高效、更智能的技术解决方案与学习辅助工具，助力开发者提升效率、解决技术难题

CSDN资讯·2025-02-18 19:29

还在熬夜做 PPT？结合Deepseek和Kimi 一键生成，效率飞起！

为什么选择Deepseek生成PPTDeepseek是一款强大的AI工具，它的中文理解和推理能力一流，能够快速精准地理解你的需求，生成逻辑清晰、内容丰富的PPT大纲和文本内容。

a小胡哦·2025-02-18 18:42

DeepSeek为什么超越了OpenAI

其中，技术架构的突破最具革命性——DeepSeek创造性地采用"混合专家系统+领域预训练"架构，在特定领域的推理效率比OpenAI的GPT-4提升40%以上（根据2023年MLPerch基准测试）。

·2025-02-18 17:19

关于用c语言实现简陋版MINE MAP

玩家通过推理，标记所有地雷的位置即可获胜。数据结构：使用二维数组表示游戏棋盘。一个数组存储地雷的位置（mineMap）。另一个数组存储玩家可见的棋盘状态（playerMap）。

cuikebinpau·2025-02-18 14:37

从零开始学习代理AI：2025全面指南

它能够通过学习和推理来完成复杂任务，如自动化客服、智能推

zxzy_org·2025-02-18 14:05

人工智能到底是什么？

以下是关于人工智能的具体介绍：定义-从技术角度：人工智能是让计算机系统具备像人类一样的感知、学习、推理、决策等能力，通过算法和数据使计算机能处理和理解各种复杂信息，如语音识别系统能听懂人类语言并转化为文字

yzx991013·2025-02-18 14:05

10分钟搭建钉钉DeepSeek AI助手：无代码实现智能对话

其中V3适用于对话AI和内容生成等通用场景，R1则专注于编程和数学等推理任务。借助阿里云百炼提供的DeepSeek模型API，我们可以轻松实现与DeepSeek的对话功能。

ivwdcwso·2025-02-18 13:59

深入剖析模型推理：原理、技术与挑战

亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！引言在当今人工智能飞速发展的时代，模型

♢.＊·2025-02-18 13:29

Docker安装分布式vLLM

Docker安装分布式vLLM1介绍vLLM是一个快速且易于使用的LLM推理和服务库，适合用于生产环境。单主机部署会遇到显存不足的问题，因此需要分布式部署。

MasonYyp·2025-02-18 13:49

nlf 3d pose 部署学习笔记

目录multi_hmr创建SemanticRenderer推理代码渲染代码：调用原版render，没成功用的pose和smlx生成vertices，也有vertices3dhmr2，用的是网络生成的vertices

AI算法网奇·2025-02-18 11:08

提示词工程中的逻辑推理结构

概念介绍：逻辑推理结构在提示词工程中是指通过系统化、精确化的推理方法，帮助生成内容时能够严谨且条理清晰地组织论点、论据及结论，确保思路顺畅且具有逻辑一致性。

由数入道·2025-02-18 08:03

腾讯云目前支持4种DeepSeek开源大模型部署方案

企业级的应用，光有大模型能力还不够，推理引擎以外，应用经验、各类原子化能力和现成的应用经验不可或缺。

szqcloud·2025-02-18 03:41

DeepSeek推理模型架构以及DeepSeek爆火的原因

大家好，我是微学AI，今天给大家介绍一下DeepSeek推理模型架构以及DeepSeek爆火的原因，DeepSeek推理模型凭借其创新的混合专家（MoE）架构和优化的Transformer架构，融合稀疏注意力机制

微学AI·2025-02-18 03:06

推荐频道

推理