LLM专题

LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？

LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？

ZhangJiQun&MXP·2025-07-12 15:44

LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的

LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的有个假设：就是最后一个词语融合了前面词语的信息减法操作主要用于提取模型内部表征中的"诚实性"概念向量。

ZhangJiQun&MXP·2025-07-12 14:40

LLM-生成器判别器的实现

总结首先，使用GPT模型获取每个词的生成概率pLLMp_{LLM}pLLM。

·2025-07-12 12:23

利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具

在本指南中，我将引导您构建一个具有本地运行的大型语言模型(LLM)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。

知识大胖·2025-07-12 11:51

使用 Ollama 、 DeepSeek和QWEN的模型上下文协议 (MCP) ，使用本地 LLM 教程的 MCP 服务器

MCP或模型上下文协议由Anthropic去年发布，它可以帮助LLM连接软件并对其进行控制。

知识大胖·2025-07-12 11:51

在 Obsidian 中本地使用 DeepSeek — 无需互联网！

简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！

知识大胖·2025-07-12 11:21

Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）

——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。

知识大胖·2025-07-12 11:50

OpenWebUI系列之如何通过docker自动将其更新到OpenWebUI最新版本

它支持各种LLM运行器，包括Ollama和OpenAI兼容API。如何通过docker自动将其更新到OpenWebUI最新版本？

知识大胖·2025-07-12 11:20

AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL

简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。

知识大胖·2025-07-12 11:20

AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序

您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。

知识大胖·2025-07-12 11:50

AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）

您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。

知识大胖·2025-07-12 11:20

【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5

理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text

我爱一条柴ya·2025-07-12 10:10

LLM 大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战

LLM大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战1.环境准备GPU设备:A10,3090,V100,A100均可.

汀、人工智能·2025-07-12 10:09

【实战AI】macbook M1 本地ollama运行deepseek

请自行；2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端（MacOS、Windows、Linux），专为无缝部署大型语言模型（LLM）（如Llama2、Mistral

东方鲤鱼·2025-07-12 08:24

思维链革命：让大模型突破“机器思考”的边界

思维链技术深度解析文章（原文链接）的博客化重构，融合技术本质与应用实践：思维链革命：让大模型突破“机器思考”的边界——解析ChainofThought技术体系与下一代推理架构一、从黑箱到透明思考：CoT的核心突破传统LLM

John Song·2025-07-12 07:13

LLM Agent在多模态任务中的推理机制详解

文章目录一、引言二、多模态LLMAgent的基本架构2.1系统组成2.2工作流程图三、多模态表示与对齐3.1跨模态嵌入空间3.2模态对齐技术四、多模态推理策略4.1基于提示的推理(Prompt-basedReasoning)4.2多模态思维链(CoT)推理4.3多模态工具使用五、实现案例：多模态问答系统5.1系统架构5.2示例应用六、高级多模态推理技术6.1多模态递归推理6.2多模态记忆与检索6.

·2025-07-12 06:12

在mac m1基于llama.cpp运行deepseek

lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。

·2025-07-12 06:41

LLaMA-Omni 深度解析：打开通往无缝人机语音交互的大门

LLaMA-Omni不仅实现了低至226ms的惊人交互延迟，还能同时生成高质量的文本与语音回复，真正意义上让大语言模型（LLM）具备了“听说”的能力。

kakaZhui·2025-07-12 06:41

在LLM快速迭代时代构建持久AI应用：架构设计与实施策略

引言：技术浪潮下的开发困境大型语言模型(LLM)的发展速度令人瞠目：从GPT-3到GPT-4，从Claude1到Claude3，从Llama1到Llama3，迭代周期正在从"年"缩短到"月"。

·2025-07-12 02:44

大型语言模型（LLM, Large Language Models）基模和 Chat 模型之间的区别

·2025-07-12 01:37

SpringBoot集成LangChain4j：构建智能AI应用全解析

在企业级应用中融入大语言模型(LLM)能力已成为趋势，而LangChain4j作为专为Java设计的LLM集成框架，与SpringBoot的结合为开发者提供了强大而灵活的解决方案。

java干货仓库·2025-07-12 00:58

专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载

原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告

·2025-07-11 23:23

专题：2025供应链数智化与效率提升报告|附100+份报告PDF、原数据表汇总下载

全文链接：https://tecdat.cn/?p=42926在全球产业链重构与数字技术革命的双重驱动下，供应链正经历从传统经验驱动向数据智能驱动的范式变革。从快消品产能区域化布局到垂类折扣企业的效率竞赛，从人形机器人的成本优化到供应链金融对中小企业的赋能，技术创新与模式重构正在重塑行业价值网络。本报告洞察基于《灼识咨询：2025中国供应链金融科技行业蓝皮书》《中国银河证券：折扣业态供应链效率深度

拓端研究室·2025-07-11 22:20

基于 esp32-s3，结合私有化大模型，集asr语音识别、llm大模型、tts语音合成，设计一个技术方案，要求用websocket保持长链接，

以下方案演示了如何基于ESP32-S3，通过私有化大模型组合ASR（语音识别）、LLM（语言大模型）和TTS（语音合成）来构建一个语音交互系统，并且通过WebSocket保持与服务器的长连接通讯。

·2025-07-11 20:03

详解LLMOps，将DevOps用于大语言模型开发

为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。

·2025-07-11 19:01

代码与 AI 的交响乐：探索 avante.nvim 的智能编程革命

本文将带你走进avante.nvim的世界，探索它如何通过大语言模型（LLM）和上下文感知机制，重新定义编程的艺术与科学。从灵感火花到代码现实：AI驱动的编程新时代想象一下，你正在编写一个复杂的P

步子哥·2025-07-11 18:48

零代码玩转大模型！LLaMA Factory：你的专属模型精修师

你是否曾对大语言模型（LLM）的强大能力心驰神往，却苦于以下难题？想定制专属模型？微调代码看不懂，环境配置太复杂…硬件资源有限？动辄需要数张A100，普通设备望而却步…中文任务不给力？

jane_xing·2025-07-11 17:41

掌握LLM工程课，让你的AI之旅充满惊喜

掌控AI时代的密码：深入LLM工程课程在人工智能迅猛发展的今天，对大语言模型（LLM）的深入理解和应用能力已经成为引领技术潮流的重要基石。

·2025-07-11 15:31

Dify小白入门指南：通过官方文档学习工作流编排和API调用

Dify小白入门指南：通过官方文档学习工作流编排和API调用一、Dify平台简介与核心功能Dify是一个开源的LLM应用开发平台，被设计为一个"生成式AI应用创新引擎"，它提供了从Agent构建到AI工作流编排

伟大无须多言·2025-07-11 12:39

大模型 Agent（智能体）技术简介

大模型Agent（智能体）技术是当前人工智能领域的前沿方向，它赋予大型语言模型（LLM）自主感知、规划、决策和行动的能力，使其不再局限于“被动应答”，而是能主动完成复杂任务。

北京地铁1号线·2025-07-11 11:35

机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】

二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。

软研科技·2025-07-11 10:52

【算法专题】双指针算法之18. 四数之和（力扣）

CILMY23·2025-07-11 08:37

专题：2025大模型2.0：GPT到DeepSeek技术演进与产业落地报告|附200+份报告PDF汇总下载

原文链接：https://tecdat.cn/?p=42738当OpenAI在2023年推出ChatGPT时，业界或许未曾预料到，短短两年后大模型会以“2.0”形态重塑产业逻辑。本报告汇总解读基于国家工业信息安全发展研究中心与联想集团联合发布的《2025大模型2.0产业发展报告》，以及哈工大计算学部人工智能学院关于DeepSeek系列模型的技术白皮书，深入剖析大模型从“技术验证”向“商业落地”跃迁

拓端研究室·2025-07-11 03:11

专题：2025数据资产AI价值化：安全、战略与应用报告|附400+份报告PDF、原数据表汇总下载

原文链接：https://tecdat.cn/?p=42885在数字经济加速渗透的今天，数据作为核心生产要素的价值愈发凸显。上市公司作为经济高质量发展的微观主体，其数据价值化进程不仅关乎企业自身竞争力，更折射出中国产业数字化转型的深度与广度。本报告洞察基于《上海数据交易所：上市公司数据价值化研究报告（2025）》《绿盟科技：全球云上数据泄露风险分析报告（第五期）》《DigitalRealty：全球

拓端研究室·2025-07-11 03:10

大模型的温度？解读Temperature

LLM温度是一个参数，它控制着LLM预测的下一个单词的概率分布。它通过改变下一个单词被选中的可能性，为LLM的输出增加了一些随机性或多样性。

半吊子全栈工匠·2025-07-11 02:31

大模型服务的推理优化探索

本文尝试讨论将LLM推理服务更改为高吞吐量引擎的挑战与应对方法。1.大模型服务面临的挑战大模型的能力令人惊叹，但其

半吊子全栈工匠·2025-07-11 02:31

人工智能-基础篇-28-模型上下文协议--MCP请求示例（JSON格式，客户端代码，服务端代码等示例）

不过，在某些AI工具链和LLM开发框架中，确实出现了以“MCP”命名的内部通信机制，尤其是在与语言模型代理（LLMAgent）和工具调用接口相关的系统中。

weisian151·2025-07-10 23:42

揭秘12-Factor Agents：打造可靠LLM应用的秘诀

探索12-FactorAgents：构建生产级LLM应用的新范式在AI飞速发展的时代，构建真正能够投入生产使用的大型语言模型（LLM）驱动的软件变得尤为重要。

人工智能我来了·2025-07-10 21:30

【GitHub开源项目实战】LLM-Cookbook 中文大模型工程手册全解析：多场景落地应用与技术优化路径深度实践

GitHub开源实战|LLM-Cookbook中文大模型工程手册全解析：多场景落地应用与技术优化路径深度实践关键词LLM-Cookbook，中文大模型，Datawhale，大模型实战，LangChain

·2025-07-10 21:59

1. RAG 权威指南：从本地实现到生产级优化的全面实践

1.RAG权威指南：从本地实现到生产级优化的全面实践大型语言模型（LLM）的知识受限于其训练数据，这是一个众所周知的痛点。

·2025-07-10 19:22

AI技术正在深度重构全球产业格局，其影响已超越工具属性，演变为推动行业变革的核心引擎。

一、AI如何重塑AI的工作与行业（AI助手领域）能力升级理解与生成：基于LLM（大语言模型），AI能处理开放式问题、撰写报告、翻译代码，替代部分人类知识工作。

·2025-07-10 18:43

[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿

当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?

张较瘦_·2025-07-10 18:42

【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个

专栏导读本专栏收录于《华为OD机试（JAVA）真题（B卷+A卷+C卷+D卷+E卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华

·2025-07-10 17:32

【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个（Python/JS/C/C++）

专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往

哪吒·2025-07-10 17:32

Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析

【关注我，后续持续新增专题博文，谢谢！！！】

一起搞IT吧·2025-07-10 15:51

从零开始：构建支持上下文窗口的AI原生应用实战指南

从零开始：构建支持上下文窗口的AI原生应用实战指南关键词：大语言模型（LLM）、上下文窗口、AI原生应用、token管理、对话状态保持、向量检索、记忆压缩摘要：本文从AI原生应用的核心需求出发，系统讲解支持上下文窗口的应用构建全流程

AI天才研究院·2025-07-10 15:49

深入剖析开源AI阅读器项目Saga Reader基于大模型的文本转换与富文本渲染优化方案

本文将介绍SagaReader项目中如何利用大型语言模型(LLM)进行网页内容抓取、智能优化和富文本渲染，特别是如何通过精心设计的提示词(prompt)引导LLM生成样式丰富的HTML内容，提升用户阅读体验

魑魅丶小鬼·2025-07-10 14:44

实操 SpringBoot+MCP！

引言随着人工智能的飞速发展，大语言模型(LLM)正在革命性地重塑用户与软件的交互范式。

清风孤客·2025-07-10 14:13

构建你的AI应用开发平台：如何在Ubuntu上使用Docker部署Dify

Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后

kaixin_啊啊·2025-07-10 12:57

vLLM 优化与调优：提升模型性能的关键策略

在当今人工智能领域，大语言模型（LLM）的应用日益广泛，而优化和调优这些模型的性能成为了至关重要的任务。vLLM作为一种高效的推理引擎，提供了多种策略来提升模型的性能。

强哥之神·2025-07-10 11:51

推荐频道

LLM专题

LLM中 最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？

LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的

LLM-生成器判别器的实现

利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具

使用 Ollama 、 DeepSeek和QWEN的模型上下文协议 (MCP) ，使用本地 LLM 教程的 MCP 服务器

在 Obsidian 中本地使用 DeepSeek — 无需互联网！

Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）

OpenWebUI系列之 如何通过docker自动将其更新到OpenWebUI最新版本

AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL

AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序

AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）

【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5

LLM 大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战

【实战AI】macbook M1 本地ollama运行deepseek

思维链革命：让大模型突破“机器思考”的边界

LLM Agent在多模态任务中的推理机制详解

在mac m1基于llama.cpp运行deepseek

LLaMA-Omni 深度解析：打开通往无缝人机语音交互的大门

在LLM快速迭代时代构建持久AI应用：架构设计与实施策略

大型语言模型（LLM, Large Language Models）基模和 Chat 模型之间的区别

SpringBoot集成LangChain4j：构建智能AI应用全解析

专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载

专题：2025供应链数智化与效率提升报告|附100+份报告PDF、原数据表汇总下载

基于 esp32-s3，结合私有化大模型，集asr语音识别、llm大模型、tts语音合成，设计一个技术方案，要求用websocket保持长链接，

详解LLMOps，将DevOps用于大语言模型开发

代码与 AI 的交响乐：探索 avante.nvim 的智能编程革命

零代码玩转大模型！LLaMA Factory：你的专属模型精修师

掌握LLM工程课，让你的AI之旅充满惊喜

Dify小白入门指南：通过官方文档学习工作流编排和API调用

大模型 Agent（智能体）技术简介

机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】

【算法专题】双指针算法之18. 四数之和（力扣）

专题：2025大模型2.0：GPT到DeepSeek技术演进与产业落地报告|附200+份报告PDF汇总下载

专题：2025数据资产AI价值化：安全、战略与应用报告|附400+份报告PDF、原数据表汇总下载

大模型的温度？解读Temperature

大模型服务的推理优化探索

人工智能-基础篇-28-模型上下文协议--MCP请求示例（JSON格式，客户端代码，服务端代码等示例）

揭秘12-Factor Agents：打造可靠LLM应用的秘诀

【GitHub开源项目实战】LLM-Cookbook 中文大模型工程手册全解析：多场景落地应用与技术优化路径深度实践

1. RAG 权威指南：从本地实现到生产级优化的全面实践

AI技术正在深度重构全球产业格局，其影响已超越工具属性，演变为推动行业变革的核心引擎。

[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿

【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个

【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个（Python/JS/C/C++）

Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析

从零开始：构建支持上下文窗口的AI原生应用实战指南

深入剖析开源AI阅读器项目Saga Reader基于大模型的文本转换与富文本渲染优化方案

实操 SpringBoot+MCP！

构建你的AI应用开发平台：如何在Ubuntu上使用Docker部署Dify

vLLM 优化与调优：提升模型性能的关键策略

LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？

OpenWebUI系列之如何通过docker自动将其更新到OpenWebUI最新版本