图谱推理第4页

主流开源大模型能力对比矩阵

模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足Qwen✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次训练

时光旅人01号·2025-03-16 12:09

AGI的学习与适应能力

与狭义人工智能(NarrowAI)专注于特定领域和特定任务不同,AGI旨在模拟人类整体认知能力,包括感知、推理、学习、计划、创造力和自我意识等。1.2AGI的重要性和

AGI大模型与大数据研究院·2025-03-16 08:14

基于 KTransformers的DeepSeek-R1 本地部署方案，成本骤降32倍！

本文将深入探讨DeepSeek-R1部署中的挑战，并介绍一款创新框架KTransformers，它能够显著降低大规模模型部署的成本并提高推理效率，从而帮助更多中小企业有效部署此类高级AI模型。

爱科技Ai·2025-03-16 07:38

程序员必看！DeepSeek全栈开发指南：从代码生成到分布式训练的黑科技解析

一、DeepSeek技术新突破：程序员必须掌握的MoE架构实战2025年2月25日，DeepSeek开源了专为MoE模型设计的DeepEP通信库，这项技术革新直接影响了分布式训练和推理效率。

AI创享派·2025-03-16 06:00

【奇点时刻】通义千问开源QwQ-32B技术洞察报告（扫盲帖）

本报告将从模型背景与定位、核心技术、性能表现与对比、部署与使用方式，以及未来潜力与可能的影响五个维度，帮助读者更好地了解这一新兴且备受瞩目的开源推理模型。

碣石潇湘无限路·2025-03-16 03:37

TensorRT-LLM保姆级教程-快速入门

随着大模型的爆火，投入到生产环境的模型参数量规模也变得越来越大（从数十亿参数到千亿参数规模），从而导致大模型的推理成本急剧增加。

大模型八哥·2025-03-16 02:34

rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用

背景rapidocr-onnxruntime是一个跨平台的OCR库，基于ONNXRuntime推理框架。目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。

原野AI·2025-03-16 02:31

NPU的应用场景：从云端到边缘

NPU的应用场景非常广泛，主要包括以下几个方面：1.云计算与数据中心AI推理服务：在云端提供高效的AI推理服务，例如图像识别、语音识别。

绿算技术·2025-03-16 02:29

模型可解释性：基于因果推理的反事实生成与决策可视化

1.技术原理与数学公式1.1因果推理基础结构方程模型（SEM）：X=fX(PaX,UX)X=f_X(Pa_X,U_X)X=fX(PaX,UX)其中PaXPa_XPaX为父节点集合，UXU_XUX为外生变量反事实定义

燃灯工作室·2025-03-15 23:43

推理流水线DAG调度：多模型组合执行优化方案

一、技术原理与数学模型1.1DAG调度核心公式设推理流水线由n个模型节点组成，定义：V={v1,v2,...,vn}V=\{v_1,v_2,...,v_n\}V={v1,v2,...,vn}为节点集合E

燃灯工作室·2025-03-15 23:12

Crawl4AI 与 BrowserUseTool 的详细对比

技术实现、适用场景等核心维度：1.核心定位对比工具Crawl4AIBrowserUseTool类型专为AI优化的网络爬虫框架浏览器自动化工具（模拟人类操作浏览器）核心目标高效获取结构化数据供AI训练/推理处理需要浏览器交互的动态网页任务典型应用大规模数据抓取

燃灯工作室·2025-03-15 23:42

基于时间序列预测的推理服务弹性扩缩容实战指南：（行业案例+数学推导+源码解析）

技术原理（数学公式）整体架构请求量预测→扩缩容决策→资源配置动态调整三阶段闭环，周期为5-30分钟核心预测模型（时间序列预测）LSTM预测公式（CSDN兼容格式）：$$h_t=\text{LSTM}(x_t,h_{t-1})\\\hat{y}_{t+1}=W_h\cdoth_t+b_h$$其中Wh∈Rd×1W_h\in\mathbb{R}^{d\times1}Wh∈Rd×1为权重矩阵，ddd为隐藏

燃灯工作室·2025-03-15 23:12

向量存储与检索器

它们对于应用程序来说非常重要，这些应用程序需要获取数据以作为模型推理的一部分进行推理，就像检索增强生成（

小码农0912·2025-03-15 22:05

《今日AI-人工智能-编程日报》-源自2025年2月28日

技术突破OpenAI发布GPT-4.5：OpenAI正式推出新一代大模型GPT-4.5，语言理解、情商及逻辑推理能力显著增强，幻觉问题大幅减少，计算效率较GPT-4提升超10倍，已逐步向用户开放试用。

小亦编辑部·2025-03-15 22:59

OpenCV 深度学习模块 cv2.dnn 与其他深度学习框架的优缺点对比及适用场景

OpenCV提供了一个深度学习模块cv2.dnn，让开发者能够在计算机视觉项目中轻松加载和推理深度学习模型。

白.夜·2025-03-15 21:26

深度学习中的 blob 格式：与普通 image 的区别及转换原因

在深度学习模型推理过程中，我们经常会用到cv2.dnn.blobFromImage函数将普通图像转换为blob格式。那么，blob格式到底是什么？它和普通image有什么区别？

白.夜·2025-03-15 21:25

DeepSeek多语言智能创作引擎解析

尤为突出的是，其分层参数激活策略将推理成本降低至传统密集模型的38%，同时维持了95%以上的任务完成精度。行业分析机构

智能计算研究中心·2025-03-15 20:22

python 基于混合式推荐算法的学术论文投稿系统

mosquito_lover1·2025-03-15 17:25

模型的秘密武器：利用注意力改善长上下文推理能力

【导语】在大语言模型（LLM）不断刷新各项任务记录的今天，很多模型宣称能处理超长上下文内容，但在实际推理过程中，复杂问题往往因隐性事实的遗漏而败下阵来。

步子哥·2025-03-15 16:51

大型语言模型与强化学习的融合：迈向通用人工智能的新范式——基于基础复现的实验平台构建

1.引言大型语言模型（LLM）在自然语言处理领域的突破，展现了强大的知识存储、推理和生成能力，为人工智能带来了新的可能性。

（initial）·2025-03-15 16:17

模型量化 (Model Quantization) 算法 (Model Quantization Algorithms)

1模型量化的必要性：降低模型大小、加速推理、减少资源消耗随着深度学习模型的日益复杂和庞大，其在资源受限的设备（如移动端、嵌入式设备）上的部署面临着巨大的挑战。

（initial）·2025-03-15 13:24

解码数字基因：数据架构如何重塑企业核心竞争力？——全面解析数据架构的战略价值与实践路径

摘要：数据架构作为企业数字化转型的“基因图谱”，通过整合业务需求与IT实现，构建起数据流动的规则体系。

领码科技·2025-03-15 07:01

认知科学：解决复杂问题的5个关键策略

这些策略包括：模式识别规则抽取推理和逻辑推理知识表示和知识图谱多模态处理我们将在接下来的部分中详细讨论这些策略，并提供代码实例和数学模型公

AI天才研究院·2025-03-15 06:25

人工智能：重塑未来生活与工作的科技力量

最初，AI的研究主要集中在逻辑推理、机器学习和自然语言处理等领域，目标是使机器能够模拟人类的智能行为。尽管在早期的探索中，AI遭遇了诸多挑战和瓶颈，但其发展潜力逐渐被认可，并在随后几十年中得到了迅速的

Geektec·2025-03-15 06:54

Anthropic 的模型

Anthropic的模型（特别是Claude系列）之所以在性能和推理能力上表现强劲，可以从技术设计、研究理念、训练方法以及应用优化等多个方面进行详细分析。

调皮的芋头·2025-03-15 06:50

DeepSeek R1有什么不同

订阅：https://rengongzhineng.io/深度思考实验室（DeepSeek）最近发布了全新的推理模型R1，声称该模型不仅性能超越目

新加坡内哥谈技术·2025-03-15 06:18

DeepSeek开源：FlashMLA深度解析：Hopper架构上的大模型推理革命

2025年2月24日，DeepSeek以「开源周」首日发布的FlashMLA技术，重新定义了Hopper架构GPU在AI推理领域的性能极限。

花生糖@·2025-03-15 03:55

LLM推理和优化（1）：基本概念介绍

一、LLM推理的核心过程：自回归生成LLM（如DeepSeek、ChatGPT、LLaMA系列等）的推理本质是自回归生成：从初始输入（如[CLS]或用户prompt）开始，逐token预测下一个词，直到生成结束符

AndrewHZ·2025-03-14 23:50

1章5节：大模型术语解读与从生成到推理的演进

DAT｜R科学与人工智能·2025-03-14 22:08

云原生周刊：基于 KubeSphere LuBan 架构打造DeepSeek 插件

·2025-03-14 22:37

从零到一：Transformer模型的原理与实战之旅

1.2自注意力机制的核心1.3Transformer的结构2.实战：构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型训练3.推理实战：完整示例与输出结果3.1

樽酒ﻬق·2025-03-14 21:06

【vLLM 学习】使用 TPU 安装

vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。

HyperAI超神经·2025-03-14 17:26

AI大模型推理加速：技术与实践详解

然而，大模型的推理速度却成为其落地应用的瓶颈。本文将详细探讨AI大模型推理加速的技术手段和实践经验，并结合具体案例进行分析。

AI大模型学习者·2025-03-14 15:43

推理大模型：技术解析与未来趋势全景

1.推理大模型的定义推理大模型（ReasoningLLMs）是专门针对复杂多步推理任务优化的大型语言模型，具备以下核心特性：输出形式创新展示完整逻辑链条（如公式推导、多阶段分析）任务类型聚焦擅长数学证明

时光旅人01号·2025-03-14 15:10

【AI论文】TPDiff：时序金字塔视频扩散模型

基于这一洞见，我们提出了TPDiff，一个统一的框架，用于提高训练和推理效率。通过将扩散过程分为几个阶段，我们的框架在扩散过程中逐步增加帧率，仅在最后阶段采用全帧率，从而优化计算效率。

东临碣石82·2025-03-14 14:31

Stable Diffusion/DALL-E 3图像生成优化策略

分块推理（TiledDiffusion）：将图像分割为512×512区块，逐块生成后无缝拼接，支持4096×40

云端源想·2025-03-14 12:16

11B模型拿下开源视频生成新SOTA！仅用224张GPU训练，训练成本省10倍

同时，此次发布全面开源模型权重、推理代码及分布式训练全流程，开发者们可以看过来！GitH

·2025-03-14 04:12

【自学笔记】讯飞星火基础知识点总览-持续更新

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录讯飞星火基础知识点总览一、讯飞星火简介二、核心功能1.语音识别2.自然语言处理3.知识图谱4.星火API三、基础概念1.AI模型2

Long_poem·2025-03-14 02:08

QwQ-32B企业级本地部署：结合XInference与Open-WebUI使用

QwQ-32B是阿里巴巴Qwen团队推出的一款推理模型，拥有320亿参数，基于Transformer架构，采用大规模强化学习方法训练而成。

大势下的牛马·2025-03-14 00:56

【大模型新书】基于RAG的生成式AI：使用LlamaIndex、Deep Lake和Pinecone构建自定义的检索增强生成管道

利用嵌入式向量数据库和集成的人类反馈来实现检索增强生成（RAG）购买本书的纸质版或Kindle版即包含免费的PDF格式电子书主要特点实现RAG的可追溯输出，将每个响应与其源文档链接，构建可靠的多模态对话智能体在管道中集成RAG、实时人类反馈改进和知识图谱

AI大模型-大飞·2025-03-13 23:18

轻量级多模型部署实践：Ollama 与 vLLM 快速构建高效 AI 工作流20250306

轻量级多模型部署实践：Ollama与vLLM快速构建高效AI工作流本文将详细介绍如何在MacOS与Ubuntu环境下使用Ollama与vLLM进行轻量级多模型部署，包括模型并行推理、安全与性能优化的实践经验

Narutolxy·2025-03-13 20:55

Neo4j笔记整理CQL大全

工作需要用到知识图谱，学习一下Neo4jCQL常规操作查询关系的父节点match(n)-[r:likes]-()returnn查询节点名称为person的前25条结点记录和查询后25条结点记录match

Kugua-F·2025-03-13 19:49

m0_65156252·2025-03-13 18:16

【LLM大模型】大模型涌现能力及 Prompt Engineering提示词

作为概率模型，大语言模型甚至不知道数字代表的真实含义，模型只是在学习了无数的语料之后，发现了一些数学结论之间的潜在概率关系，才最终涌现出了数学运算或者复杂推理的能力。但是“涌现能力

Langchain·2025-03-13 18:15

seq2seq推理模块设计

代码：#loadcheckpoints,如何上线model=Sequence2Sequence(len(src_word2idx),len(trg_word2idx))model.load_state_dict(torch.load(f"./best.ckpt",weights_only=True,map_location="cpu"))classTranslator:def__init__(se

何仙鸟·2025-03-13 18:40

LLM Weekly（2025.03.03-03.09）

研究人员推出了QwQ-32B，这是一个拥有320亿参数的模型，它利用强化学习来提升推理能力。尽管参数较少，但通过整合类似智能体的推理和反馈机制，QwQ-32B的表现可与更大规模的模型相媲美。

UnknownBody·2025-03-13 16:29

支持 40+ 插件，Spring AI Alibaba 简化智能体私有数据集成

RAG通过结合检索技术和生成模型的强大能力，使智能体能够实时从外部数据源获取信息，并在生成过程中增强其知识深度和推理能力。通过这种方式，智能体不仅能依赖于模型的预

阿里云云原生·2025-03-13 16:29

SaaS+AI应用架构：业务场景、智能体、大模型、知识库、传统工具系统

本节将详细介绍其五个核心层次：业务场景层：发现和确定业务场景智能体层：构建可复用的智能应用大模型层：采用最合适的大模型，作为思考推理的核心知识库：管理企业的核心知识资产传统工具：传统的运营工具和业务系统业务场景层

公众号-AI架构师汤师爷·2025-03-13 16:26

本地部署时，如何通过硬件加速（如 CUDA、TensorRT）提升 DeepSeek 的推理性能？不同显卡型号的兼容性如何测试？

本地部署DeepSeek模型的硬件加速优化与显卡兼容性测试指南一、硬件加速技术实现路径CUDA基础环境搭建版本匹配原则：根据显卡架构选择CUDA版本（如NVIDIARTX50系列需CUDA12+，V100需CUDA11.x），并通过nvcc--version验证安装。GPU加速验证：运行以下代码检查硬件加速状态：importtensorflowastfprint("可用GPU数量：",len(tf

百态老人·2025-03-13 14:43

【图像去噪】论文复现：TPAMI 2025！全面提升单图像去噪泛化性！像素级零样本去噪方法Pixel2Pixel的Pytorch源码复现，跑通源码，修改各种报错，框架详解，注释详细！

本文亮点：跑通Pixel2Pixel全部源码，包含数据集准备、制作像素库(PixelBank)、训练和推理等，

十小大·2025-03-13 14:11

推荐频道

图谱推理