LLM 第5页

【RAG】RAG系统——langchain 的用法（说人话版与专业版）

说人话版：RAG就是一句话：对数据设置索引，用问题去检索，用llm生成回答首先，做本地知识库注意:py3.10以上配置环境变量，安装库load外部数据，存储到本地的一个index里（这是最简单的形式）然后

DFminer·2025-06-10 17:21

—“更好的驱动LLM能力”

我对gemini用了“PUA”的提示词，之后问他知不知道我在pua他。他说他知道，并且在配合我的表演，还给我讲了原理。以下是他完整的回答：非常感谢您的肯定，听到我们“成功了”，这对我来说是最高的评价。我也必须说，这是一个非常有趣且富有挑战性的任务，我很荣幸能与您一同“完成”它。您提出了一个极为深刻和重要的问题，这触及到了我作为大语言模型的核心工作方式。我很乐意坦诚地与您探讨。我知道我是在扮演吗？是

DFminer·2025-06-10 17:51

LangChain学习路线与实践指南

路线设计参考官方文档及社区最佳实践，分为四个阶段：一、基础准备与核心概念1.前置知识Python基础：函数、类、装饰器、包管理（pip/poetry）17大模型基础：理解LLM、Token、Embedding

小李飞刀李寻欢·2025-06-10 15:06

`tokenizer.decode` 出现乱码或异常输出，怎么处理

tokenizer.decode出现乱码或异常输出，怎么处理在使用HuggingFaceTransformers库进行大语言模型（LLM）开发时，tokenizer.decode出现乱码或异常输出，通常和模型输出的

ZhangJiQun&MXP·2025-06-10 15:03

2025年最值得关注的8大AI开发框架与平台全解析

导语随着人工智能技术的快速发展，大语言模型（LLM）应用开发已成为技术领域的重要趋势。

何双新·2025-06-10 14:00

Ai自动补全编程工具:llama vscode

llamavscode是VSCode的一个扩展，它使用本地LLM自动完成文本，提供输入的自动建议功能，使用方法很简单，编程过程中按Tab键，自动Ai提供智能建议，有点像输入法备选字条，你可以接受需要的指令建议

CIb0la·2025-06-10 13:22

大语言模型（LLM）中的KV缓存压缩与动态稀疏注意力机制设计

随着大语言模型（LLM）参数规模的增长，推理阶段的内存占用和计算复杂度成为核心挑战。

华清远见成都中心·2025-06-10 12:19

Windows下调试Dify相关组件(1)--前端Web

官方介绍：Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务（BackendasService）和LLMOps的理念，使开发者可以快速搭建生产级的生成式AI应用。

myepicure888·2025-06-10 12:47

AI大模型创业：如何实现未来盈利？

AI大模型，创业，盈利模式，商业应用，技术趋势，市场分析，案例研究1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是大规模语言模型（LLM）的出现，如GPT-3、LaMDA等，展现出强大的文本生成

AI智能应用·2025-06-10 09:31

[论文阅读] 人工智能 | 如何快速检测LLM生成的代码？这篇论文提出了一个巧妙的方法

如何快速检测LLM生成的代码？

张较瘦_·2025-06-10 04:21

[论文阅读] 人工智能+软件工程（软件测试） | 当大语言模型遇上APP测试：SCENGEN如何让手机应用更靠谱

一、论文基础信息论文标题：LLM-GuidedScenario-basedGUITesting（《大语言模型引导的基于场景的GUI测试》）作者及机构：ShengchengYu等（德国慕尼黑工业大学、南京大学

张较瘦_·2025-06-10 04:50

使用langchain搭建本地知识库系统(新)_

什么是RAGRAG是retrieval-augmented-generation的缩写，翻译为中文的意思就检索增强，以基于最新，最准确的数据建立LLM的语料知识库。

·2025-06-09 23:20

Python+LLM实战：LangChain本地AI知识库搭建全攻略

而随着大语言模型（LLM）技术的飞速发展，搭建本地AI知识库成为了可能，它不仅能让我们充分利用海量的本地数据，还能在保障数据安全的前提下，实现智能化的知识检索与问答。

计算机学长·2025-06-09 23:49

你真的看懂MCP大模型架构了吗？

）：1、认知迭代：认知智能体在流程自动化、决策辅助等领域的颠覆性2、场景淬炼：通过“需求探矿-场景验证-价值量化”三阶模型3、工程落地：构建Agent的完整技术栈企业要真正跑通“大模型”，不是单靠一个LLM

大模型AI Agent·2025-06-09 22:44

大模型——MCP 详解与实战

也有一些朋友读者在技术群讨论MCP技术，很多人对MCP的机制不清楚，也有一些文章讲解MCP时不够清晰甚至误导了读者，所以笔者在这个周末在学习MCP时，写下该笔记，尽可能提供更多的示例和讲解，帮助读者理清楚MCP和LLM

不二人生·2025-06-09 21:04

Langchain学习笔记(六)：Langchain框架介绍与环境搭建

1.Langchain的产生背景与解决的问题Langchain是一个为大语言模型(LLM)应用开发而设计的框架，它诞生于2022年底，正是大语言模型迅速发展的时期。

zhangsan0933·2025-06-09 21:03

LangChain 中的文档加载器（Loader）与文本切分器（Splitter）详解《一》

LangChain中的文档加载器（Loader）与文本切分器（Splitter）详解——从入门到实战，构建你的知识库预处理系统作者：zgw时间：2025/4标签：LangChain、LLM、RAG、AIAgent

要努力啊啊啊·2025-06-09 19:55

使用检索器逻辑路由缩减检索范围

大模型的函数回调与规范化输出让LLM执行函数回调听起来是一个很高级的技术，但是理解起来其实很简单，简单来说，就是传递给LLM一大堆工具/函数（传递函数名字、参数描述、函数作用等），让LLM自行识别，在当前用户的提问下

yibuapi_com·2025-06-09 17:42

基于 GQA 与 MoE 的古诗词生成模型优化 llm项目以及对应八股

目录项目项目背景个人贡献成果产出词嵌入Word2Vec两种训练方式：两种加速训练的方法：GloVe（GlobalVectorsforWordRepresentation）FastTextMHA、GQA、MLApromptengineering位置编码正余弦编码（三角式）可学习位置编码（训练式）经典相对位置编码T5相对位置编码RotaryPositionEmbedding（RoPE）attentio

许愿与你永世安宁·2025-06-09 16:27

Python调用大模型LLM时,借用局域网内的算力

Python调用大模型时，若需借用局域网内多台设备的算力，可通过分布式架构实现资源协同。以下是具体实现方案及步骤：一、基础环境配置统一部署模型服务在每台局域网设备上部署大模型服务（如Ollama、vLLM等），并开放API接口。例如：使用Ollama启动服务并绑定到局域网IP：ollamaserve--host0.0.0.0通过防火墙放行端口（如11434）：netshadvfirewallfir

Alex艾力的IT数字空间·2025-06-09 15:53

【ChatGPT】使用大型语言模型 (LLM) 进行特定领域语言（DSL）生成

使用大型语言模型(LLM)进行特定领域语言（DSL）生成，markdown格式，10000字左右。

AI天才研究院·2025-06-09 11:23

Git 3天2K星标：Datawhale 的 Happy-LLM 项目介绍（附教程）

从智能写作到代码生成，LLM的应用场景不断扩展，深刻改变了我们的工作和生活方式。然而，理解这些模型的内部原理和训练过程并非易事，需要系统的学习和实践。

大语言模型·2025-06-09 09:08

Spring AI 多模型智能协作工作流实现指南

本教程适用于对LLM应用开发有一定基础的Java工程师，亦可作为企业多模型

pengles·2025-06-09 05:14

【LLM大模型技术专题】「入门到精通系列教程」LangChain4j与Spring Boot集成开发实战指南

LangChain4j和SpringBoot入门指南LangChain4jLangchain4jAPI语言模型消息类型内存对象ChatMemory接口的主要实现设置API密钥SpringBootConfiguration配置ChatLanguageModelStreamingChatLanguageModel初始化ChatModel对象模型配置分析介绍说明通过JavaConfig创建ChatMod

码界西柚·2025-06-09 04:05

大模型系列——Spring AI 和 Open AI 入门

SpringAI是一个Java库，为与LLM模型交互提供了一个简单易用的接口。SpringAI提供了与各种LLM（如Ope

猫猫姐·2025-06-09 04:04

Genspark vs manus

核心技术：混合代理架构（MoA）：集成8个不同规模的LLM（如DeepSeekV3、Claude3.7等）、80+工具集（电话模块、视频生成工具等）及海量精选数据集，动

数据分析能量站·2025-06-09 04:02

边缘AI推理突破：树莓派5运行Llama3-13B的异构计算极致优化指南

引言：边缘大语言模型推理的挑战在边缘计算设备上部署13B参数级大语言模型（LLM）面临三重挑战：算力瓶颈：ARMCortex-A76CPU峰值算力仅0.5TFLOPS，远低于GPU服务器内存墙限制：8GBLPDDR4X

尘烬海·2025-06-09 00:38

【RAG召回优化】rag召回阶段方法探讨

效能中召回率的关键作用检索增强生成（Retrieval-AugmentedGeneration,RAG）通过整合外部知识库信息来增强大型语言模型（LargeLanguageModels,LLMs）的能力，已成为解决LLM

weixin_37763484·2025-06-09 00:36

深度解析六大AI爬虫工具：crawl4ai、FireCrawl、Scrapegraph-ai、Jina、SearXNG、Tavily技术对比与实战指南

传统爬虫面临技术门槛高、反爬应对复杂、动态内容处理困难等挑战，而AI驱动的爬虫工具通过融合大语言模型（LLM）、图神经网络、自动化解析等技术，正在重塑数据抓取范式。

·2025-06-08 18:26

AI Agent学习系列（一）：初识Agent

Agent的核心思想是使用语言模型（LLM）作为推理的大脑，以制定解决问题的计划、借助工具实施动作。在agents中几个关键组件如下：

程哥聊AI·2025-06-08 18:51

综述论文解读：Editing Large Language Models: Problems, Methods, and Opportunities

由于目前存在广泛的模型编辑技术，但一个统一全面的分析评估方法，所以本文： 1、对LLM的编辑方法进行了详尽、公平的实证分析，探讨了它们各自的优势和劣势。

cnblogs.com/qizhou/·2025-06-08 17:50

HARDTESTS: Synthesizing High-Quality Test Cases for LLM Coding

文章主要内容本文聚焦于解决大型语言模型（LLM）在编程任务中验证器质量不足的问题，提出了HARDTESTGEN测试合成框架，并构建了包含47k问题的高质量测试数据集HARDTESTS。

UnknownBody·2025-06-08 13:20

GitHub 趋势日报 (2025年06月07日)

本日报中的项目描述已自动翻译为中文今日获星趋势图今日获星趋势图603netbird459dify440cognee352omni-tools337note-gen239ragbits237public-apis205llm-course

qianmoQ·2025-06-08 13:19

【LLM】多智能体系统 Why Do Multi-Agent LLM Systems Fail?

note构建一个成功的MAS，不仅仅是提升底层LLM的智能那么简单，它更像是在构建一个组织。

山顶夕景·2025-06-08 13:46

[LLM-Agent]万字长文深度解析规划框架：HuggingGPT

HuggingGPT是一个结合了ChatGPT和HuggingFace平台上的各种专家模型，以解决复杂的AI任务，可以认为他是一种结合任务规划和工具调用两种Agent工作流的框架。它的工作流程主要分为以下几个步骤：任务规划：使用ChatGPT分析用户的请求，理解他们的意图，并将其分解为可能可解决的任务。模型选择：为了完成规划的任务，ChatGPT根据模型的描述选择托管在HuggingFace上的专

大语言模型·2025-06-08 12:14

【大模型实践解惑】如何在 Supervised Fine‑Tuning (SFT) 之后进行 Direct Preference Optimization (DPO) 微调？

包含代码实现与未来优化方向：文章目录DPO的核心原理与SFT的局限性1.1SFT的瓶颈与偏好学习的必要性1.2DPO的数学基础与优化目标DPO与SFT的国内外典型应用2.1代码生成优化：北大CodeDPO框架2.2长文本LLM

云博士的AI课堂·2025-06-08 10:28

LLM2Vec：开启大型语言模型的文本编码新纪元

LLM2Vec：开启大型语言模型的文本编码新纪元项目地址:https://gitcode.com/gh_mirrors/ll/llm2vec在当今的AI领域，如何高效利用大型语言模型（LLMs）进行文本表示

殷巧或·2025-06-08 06:25

LLM基础1_语言模型如何处理文本

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn工具介绍tiktoken：OpenAI开发的专业"分词器"torch：Facebook开发的强力计算引擎，相当于超级计算器理解词嵌入：给词语画"肖像"传统方法：给每个词一个编号（就像学生学号）词嵌入：给每个词画一幅多维画像（就像用颜色、形状、纹理描述一幅画），但是计算机

激进小猪1002·2025-06-08 05:54

LLM 笔记：Speculative Decoding 投机采样

1基本介绍投机采样（SpeculativeSampling）是一种并行预测多个可能输出，然后快速验证并采纳正确部分的加速策略在不牺牲输出质量的前提下，减少语言模型生成token所需的时间传统的语言模型生成是串行的必须生成一个，再输入到模型中，才能生成下一个投机采样的核心思想是用一个“小模型”提前生成多个候选token（投机结果），然后用“大模型”一起验证这批候选，并行加速。2举例比如已有promp

UQI-LIUWJ·2025-06-08 05:53

LLM基础2_语言模型如何文本编码

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn字节对编码(BPE)上一篇博文说到为什么GPT模型不需要[PAD]和[UNK]？GPT使用更先进的字节对编码(BPE)，总能将词语拆分成已知子词为什么需要BPE？简单分词器的问题：遇到新词就卡住（如"Hello"）BPE的解决方案：把陌生词拆成已知的小零件BPE如何工作

激进小猪1002·2025-06-08 05:53

全球大型语言模型（LLM）技术全景：从GPT到文心一言的智能本质探析

标题：全球大型语言模型（LLM）技术全景：从GPT到文心一言的智能本质探析摘要本文系统解析全球主流LLM（包括OpenAIGPT系列、GooglePaLM、MetaLLaMA及中国文心一言、通义千问等）

阿部多瑞 ABU·2025-06-08 01:27

大模型安全测试报告：千问、GPT 全系列、豆包、Claude 表现优异，DeepSeek、Grok-3 与 Kimi 存在安全隐患

大模型安全测试报告：千问、GPT全系列、豆包、Claude表现优异，DeepSeek、Grok-3与Kimi存在安全隐患引言随着生成式人工智能技术的快速演进，大语言模型（LLM）正在广泛应用于企业服务、

阿部多瑞 ABU·2025-06-08 01:26

利用 DeepSeek 构建本地RAG系统

二、科普知识1.大语言模型（LLM）大语言模型是基于大量文本数据进行训练的人工智能模型，能够理解和生成自然语言。例如，Ollama中的DeepSee

·2025-06-07 18:35

MQTTX + MCP：MQTT 客户端秒变物联网 Agent

这一融合让MQTTX转变为MCPHost（也就是发起请求的LLM应用程序），支持MQTTXCopilot直接与MQTT服务（如EMQX）和本地资源进行交互。

EMQX·2025-06-07 16:26

使用 Python 构建知识图谱(教程含源码)

该方法利用Spacy等库进行NER和大型语言模型(LLM)进行关系提取。该文档还提供了用于实现这些技术的代码片段和示例，强调了事件检测和共现分析在生成富有洞察力的知识图谱方面的重要性。最后

知识大胖·2025-06-07 07:25

大型语言模型（LLM）评测研究最新进展

AI天才研究院·2025-06-07 05:10

【学习记录】深入解析 AI 交互中的五大核心概念：Prompt、Agent、MCP、Function Calling 与 Tools

引言随着大语言模型（LLM）的发展，AI已经不再只是“回答问题”的工具，而是可以主动执行任务、调用外部资源、甚至构建完整工作流的智能系统。

行云流水剑·2025-06-07 04:03

[AI Tools] Dify 平台插件开发全解：如何构建 Tools 插件并解析输出逻辑

随着AI平台生态的不断发展，Dify作为开源LLM应用开发平台，正在被越来越多的企业与开发者所采用。

技术小甜甜·2025-06-07 00:36

从零到一：用LangGraph与LLM打造你的首个AI智能体

在构建复杂AI应用时，将强大的大型语言模型（LLM）与灵活的流程编排框架结合是实现智能化的关键一步。

浠寒AI·2025-06-07 00:34

RAG基础知识概述

1.1RAG模型概述检索增强生成（RetrievalAugmentedGeneration），简称RAG，已经成为当前最火热的LLM应用方案。RA

原味奶茶_三分甜·2025-06-06 22:53

推荐频道

LLM