LLm 第13页

本地大模型编程实战(25)用langgraph实现基于SQL数据构建的问答系统(4)

使大语言模型(LLM)查询结构化数据与非结构化文本数据有所不同。查询非结构化数据时，通常需要将待查询的文本嵌入到向量数据库中；而查询结构化数据的方法则是让LLM编写和执行DSL（例如SQL）进行查询。

火云牌神·2025-03-01 14:47

Meta：基于数据关系的LLM高效预训练

标题：Data-EfficientPretrainingwithGroup-LevelDataInfluenceModeling来源：arXiv,2502.14709摘要数据高效的预训练已显示出提高缩放定律的巨大潜力。本文认为有效的预训练数据应该在组级别进行管理，将一组数据点作为一个整体而不是独立的贡献者。为此，我们提出了一种新的数据高效预训练方法GroupLevelDataInfluenceMo

大模型任我行·2025-03-01 12:37

提升AI测试效率：如何通过RAG技术优化LLM输出质量

用ChatGPT做软件测试随着人工智能（AI）和大规模语言模型（LLM）在软件测试领域的应用日益广泛，测试效率和质量的提升成为业界关注的焦点。

测试者家园·2025-03-01 12:05

AI大模型-提示工程学习笔记21-图提示 (Graph Prompting)

目录1.图提示的核心思想(1)传统提示的局限性(2)GraphPrompting的解决方案2.GraphPrompting的工作流程(1)图构建(2)图选择/子图提取(3)图编码(4)提示构建(5)LLM

9命怪猫·2025-03-01 12:30

LangChain 核心概念与架构详解

简介LangChain是一个强大的框架，专注于构建基于大语言模型(LLM)的应用。本文将深入介绍LangChain的核心架构、关键组件以及其特性。

dgay_hua·2025-03-01 09:05

借助知识图谱和Llama-Index实现基于大模型的RAG

对于LLM中的幻觉问题，知识图谱是一个比向量数据库更好的解决方案。知识图谱为L

爱吃牛油果的璐璐·2025-03-01 08:32

全网国内外总结Prompt&LLM论文，开源数据&模型，AIGC应用（持续更新，收藏查看）

全网国内外总结Prompt&LLM论文，开源数据&模型，AIGC应用（持续更新，收藏查看）目录顺序如下国内外，垂直领域大模型Agent和指令微调等训练框架开源指令，预训练，rlhf，对话，agent训练数据梳理

代码讲故事·2025-03-01 07:54

[LangChain 学习资源大集合]

在构建语言模型应用（LLM）时，LangChain是当前备受关注的框架之一。无论是初学者还是进阶用户，丰富的学习资源可以帮助我们高效掌握LangChain的核心概念、工具和最佳实践。

qahaj·2025-03-01 06:39

MCP模型上下文协议集锦

MCP模型上下文协议简介MCP模型上下文协议（Model-Context-Protocol，MCP），能够实现大型语言模型（LLM）应用程序与本地或远程资源之间的安全、可控的交互。

galileo2016·2025-03-01 06:09

Open WebUI：开源AI交互平台的全面解析

提供直观的聊天界面设计跨平台响应式设计:完美适配桌面/移动端即时响应:毫秒级响应速度富文本支持:代码语法高亮完整Markdown/LaTeX渲染语音输入支持（支持静音自动提交）模型管理多模型切换:支持不同LLM

·2025-03-01 06:17

大语言模型LLM原理篇_图解大模型从用户输入prompt到llm输出答案的流程原理

大模型席卷全球，彷佛得模型者得天下。对于IT行业来说，以后可能没有各种软件了，只有各种各样的智体（Agent）调用各种各样的API。在这种大势下，笔者也阅读了很多大模型相关的资料，和很多新手一样，开始脑子里都是一团乱麻，随着相关文章越读越多，再进行内容梳理，终于理清了一条清晰的脉络。笔者写原理篇时心情是有些惴惴不安的，因为毕竟对大模型的研究有限，缺乏深度。但是，还是觉得有必要记录一下学习理解心得，

喝不喝奶茶丫·2025-03-01 05:01

开发基于提示工程的大语言模型（LLM）应用——学习笔记

本文是学习笔记。学习通过提示工程与大语言模型进行程序化的交互。将从最基本的开始，比如使用哪些模型，以及如何向它们发送提示词并查看响应。将逐步构建更复杂的提示词，并学习LangChain为我们提供的、用于与大语言模型交互的丰富工具。Langchain链核心是运行时（runnable），它们能以多种方式组合的为工作流。如何创建LangChain链 fromlangchain_nvidia_ai_end

ricky_fan·2025-03-01 05:31

《AI大模型开发笔记》——提示词工程

1.什么是提示工程提示工程（PromptEngineering），也被称为上下文学习，是指通过精心设计的提示技术来引导LLM行为，而无需更改模型权重。其目标是使模型输出与给定任务的人类意图一致。

Richard Chijq·2025-03-01 04:27

[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案

https://github.com/sramshetty/ShortGPT/tree/mainMy剪枝方案（暂定）：剪枝目标：1.5B—>100～600M剪枝方法：层粒度剪枝1、基于BI分数选择P%的冗余层，P=60~802、对前N%冗余层，直接删除fulllayer。N=20（N：剪枝崩溃临界点，LLaMA2在45%，Mistral-7B在35%，Qwen在20%，Phi-2在25%）对后(P

心心喵·2025-03-01 04:25

GitHub每日最火火火项目（2.28）

olmocr项目介绍：olmocr是由allenai开发的一款用于将PDF文件线性化，以适配大语言模型（LLM）数据集和训练的工具包。在大语言模型的训练过程中，数据的格式和预处理极为关键。

FutureUniant·2025-03-01 03:50

GitHub 星标10W+的大模型书籍：《轻松入门大模型应用开发：GPT-4 和 ChatGPT 实战指南》，25年一书通关LLM大模型

当下大模型这么火，还有人很多人想加入进来，但是不知道怎么去学习，那么今天我就给大家分享一本适合所有人的一本神仙级入门大模型的书籍，小白也能学会。它是由奥利维耶·卡埃朗和玛丽-艾丽斯·布莱特合著的一本《大模型应用开发极简入门：基于GPT-4和ChatGPT》，为初学者提供一份清晰、全面的“可用知识”，帮助读者快速了解GPT-4和ChatGPT的工作原理及优势。此书使用流行的Python编程语言来构建

程序员丸子·2025-03-01 03:19

大模型研究：DeepSeek三个版本（初级中级高级）资源要求说明

以下是DeepSeek-LLM7BChat、DeepSeek-V3、DeepSeek-LLM6.7B三个版本模型所需硬件资源的介绍：DeepSeek-LLM6.7B最小最基础版本1.内存（RAM）非量化运行时

程序猿学长·2025-03-01 01:08

Open WebUI：开源AI交互平台的全面解析

提供直观的聊天界面设计跨平台响应式设计:完美适配桌面/移动端即时响应:毫秒级响应速度富文本支持:代码语法高亮完整Markdown/LaTeX渲染语音输入支持（支持静音自动提交）模型管理多模型切换:支持不同LLM

·2025-03-01 01:42

一文看懂 Claude 3.7 Sonnet，为什么是第一个融合推理模式的 AI 模型

传统的大语言模型（LLM）通常有两种工作方式

董董灿是个攻城狮·2025-02-28 22:45

【llm对话系统】大模型源码分析之 LLaMA 模型的 Masked Attention

在大型语言模型（LLM）中，注意力机制（AttentionMechanism）是核心组成部分。

kakaZhui·2025-02-28 20:03

饿了么算法工程师-AIGC岗内推

飞300·2025-02-28 15:26

2025年，值得关注的LLM大趋势

面对这些变化，2025年LLM的大趋势值得我们关注。LLM的新兴应用：不仅仅是聊天机器人回想起最初我们用ChatGPT来生成代码或修改文本时，可能没有意

AI小白熊·2025-02-28 15:25

DeepSeek掘金——DeepSeek R1架构和训练过程图解

它目前在LLM领域很流行，并且表现优于开源和闭源模型。为了让一切变得简单，我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。事实上，我们将在整个博客

不二人生·2025-02-28 12:09

大模型调优方法：提示工程、RAGs 与微调对比

就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。

AI大模型探索者·2025-02-28 11:03

【有啥问啥】深入了解 FlashMLA：Hopper GPU 的高效 MLA 解码内核

深入了解FlashMLA：HopperGPU的高效MLA解码内核简介在人工智能(AI)领域，特别是大型语言模型(LLM)领域，对计算效率和速度的需求持续增长。

有啥问啥·2025-02-28 09:12

DeepSeek R1 简单指南：架构、训练、本地部署和硬件要求

DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法，通过强化学习（RL）提升大型语言模型（LLM）的推理能力。

爱喝白开水a·2025-02-28 07:52

Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路

比如，某顶尖LLM在回答以下问题时出现了自相矛

步子哥·2025-02-28 07:19

GPT-4提示词冠军如何写 prompt：CO-STAR 框架、文本分段、系统提示

©上下文：为任务提供背景信息通过为大语言模型（LLM）提供详细的背景信息，可以帮助它精确理解讨论的具体场景，确保提供的反馈具有相关性。

天涯倦客的美丽人生·2025-02-28 04:58

游戏语音趋势解析，社交互动有助于营造沉浸式体验

语音交互的新架构出现2024年标志着对话语音AI取得了突破，出现了结合STT→LLM→TTS模型来聆听、推理和回应对话的协同语音系统。

网易数智·2025-02-28 03:22

大模型替代程序猿？不可能，绝对不可能！进化路线来了来！！！

大模型后端开发面试指南：技术体系构建与实践路线一、背景说明随着大模型（LLM）技术进入工业化落地阶段，行业对大模型后端开发工程师的需求呈现爆发式增长。

XiaoDuofCSDN·2025-02-28 03:48

通过vLLM部署LLM模型到生产环境中

文章目录1使用vLLM部署模型2部署过程2.1准备GPU环境2.2安装vLLM依赖项3使用vLLM部署模型并启动服务3.1部署开源模型3.2部署微调模型4测试服务是否正常运行5评估服务性能1使用vLLM部署模型本地部署模型主要包含下载模型、编写模型加载代码和发布为支持API访问的应用服务这三个步骤。这个过程通常伴随较高的人工部署成本，vLLM可以用来简化这一流程。它是一个专为大模型推理设计的开源框

MichaelIp·2025-02-28 01:04

UnionLLM——通过统一接口调用国内外所有LLM的Python开源工具包

最近忙里偷闲和公司前端小伙伴一起撸了一个Python开源项目——UnionLLM。这是一个通过与OpenAI兼容的统一方式调用各种国内外各种大语言模型和Agent编排工具的轻量级开源工具包。我们开发它的起因是因为在实际项目中，经常需要调用多个大语言模型的API，但是国内每个大语言模型的接口和参数都不一样，这给我们的工作带来了很大的困扰和额外的成本。UnionLLM的目标是通过统一且容易扩展的方式连

everfly·2025-02-28 00:57

手把手教你用Docker部署Dify平台，打造可视化LLM应用环境

“Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务（BackendasService）和LLMOps的理念，使开发者可以快速搭建生产级的生成式AI应用。

脱泥不tony·2025-02-27 22:40

微调 LLM （RLHF + DPO）

微调LLM（RLHF+DPO）使用强化学习（RL）根据人类反馈微调大语言模型（即RLHF）的方法，以及一种更有效的改进方法（即DPO）。

·2025-02-27 21:56

让 LLM 来评判 | 设计你自己的评估 prompt

设计你自己的评估prompt这是让LLM来评判系列文章的第三篇，敬请关注系列文章:基础概念选择LLM评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示通用prompt设计建议我总结的互联网上通用

·2025-02-27 21:49

探索 LangChain: 架构、组件和应用

介绍每个组件及其用途：1.ModelModel组件是LangChain的核心，它抽象并提供了大语言模型（LLM）的接口。

田猿笔记·2025-02-27 17:23

大数据最全大模型入门到应用——LangChain：索引（Indexes）-[文本分割器

总目录LangChain系列文章：基础知识快速入门安装与环境配置链（Chains）、代理（Agent:）和记忆（Memory）快速开发聊天模型模型（Models）基础知识大型语言模型（LLMs）基础知识LLM

2401_84182507·2025-02-27 17:22

大模型入门到应用——LangChain：索引（Indexes）-[文本分割器(2)

快速入门安装与环境配置链（Chains）、代理（Agent:）和记忆（Memory）快速开发聊天模型模型（Models）基础知识大型语言模型（LLMs）基础知识LLM的异步API、自定义LLM包装器、虚假

2301_78399616·2025-02-27 17:21

LangChain：Models、Prompts、Indexes、Memory、Chains、Agents。MaxKB

Models（模型）：指代各类大语言模型（LLM），是提供语言处理和生成能力的基础。如

ZhangJiQun&MXP·2025-02-27 16:21

自编大模型系列之 01 使用 Python 从头构建 LLaMA 3 编写您自己的十亿参数LLM（教程含源码）

我之前在Medium上写过一篇博客，介绍如何使用LLaMA架构从头开始创建一个具有超过230万个参数的LLM。现在LLaMA-3已经发布，我们将以更简单的方式重新创建它。

知识大胖·2025-02-27 10:33

基于OneAPI+ChatGLM3-6B+FastGPT搭建LLM大语言模型知识库问答系统

搭建大语言模型知识库问答系统部署OneAPI拉取镜像bash复制代码dockerpulljustsong/one-api创建挂载目录bash复制代码mkdir-p/usr/local/docker/oneapi启动容器bash复制代码dockerrun--nameone-api-d--restartalways-p3001:3000-eTZ=Asia/Shanghai-v/usr/local/do

闯江湖50年·2025-02-27 09:31

大语言模型(LLM)入门学习路线图，附资源汇总，收藏这篇就够了

Github项目上有一个[大语言模型学习路线笔记]“大语言模型学习路线笔记”)，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。

AI小白熊·2025-02-27 06:34

LLMs之ReACT-Agent：ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让LLM稳定输出JSON格式数据)之详细攻略

LLMs之ReACT-Agent：ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让LLM稳定输出JSON格式数据)之详细攻略目录相关文章

一个处女座的程序猿·2025-02-27 00:46

【Python大语言模型系列】如何在LangChain中使用ReAct构建AI Agent（案例+源码）

一、引言========当前，在各个大厂纷纷卷LLM的情况下，各自都借助自己的LLM推出了自己的AIAgent，比如字节的Coze，百度的千帆等，还有开源的Dify。你是否想知道其中的原理？

脱泥不tony·2025-02-27 00:12

GGUF 文件格式全解析

随着大语言模型(LLM)的广泛应用，如何高效地存储和加载这些复杂的模型成为一个亟待解决的问题。

Just_Paranoid·2025-02-26 22:25

ThinkJSON:通过强化学习让大型语言模型（LLM）严格遵守JSON模式

标题：ThinkInsidetheJSON:ReinforcementStrategyforStrictLLMSchemaAdherence作者：BhavikAgarwal,IshanJoshi,ViktoriaRojkova机构：MasterControlAIResearch链接：arXiv:2502.14905v1本文提出了一种轻量级强化学习框架，通过合成数据、多奖励函数和GRPO优化，显著提

AI仙人掌·2025-02-26 20:17

全面分析 DeepSeek 的新开源 FlashMLA

这一进展对于大型语言模型（LLM）来说意义重大，因为大型语言模型在推理过程中面临内存和计算方面的挑战，尤其是长序列。

X.Cristiano·2025-02-26 19:34

Google搜索免费API访问

X.Cristiano·2025-02-26 19:04

DeepSeep开源周，第三天：DeepGEMM是啥？

对开发者的用处性能提升优化计算密集型任务（如LLM训练/推理），降低延迟，提升吞吐量。支持混合精度计算

程序员差不多先生·2025-02-26 19:33

推荐：LangChain — 构建情境感知推理应用的利器

BuildingapplicationswithLLMsthroughcomposability⚡项目地址:https://gitcode.com/gh_mirrors/la/langchainLangChain，一款专为开发基于大型语言模型（LLM

成婕秀Timothy·2025-02-26 19:33

推荐频道

LLm

本地大模型编程实战(25)用langgraph实现基于SQL数据构建的问答系统(4)

Meta：基于数据关系的LLM高效预训练

提升AI测试效率：如何通过RAG技术优化LLM输出质量

AI大模型-提示工程学习笔记21-图提示 (Graph Prompting)

**LangChain 核心概念与架构详解**

借助知识图谱和Llama-Index实现基于大模型的RAG

全网国内外总结Prompt&LLM论文，开源数据&模型，AIGC应用（持续更新，收藏查看）

[LangChain 学习资源大集合]

MCP模型上下文协议集锦

Open WebUI：开源AI交互平台的全面解析

大语言模型LLM原理篇_图解大模型从用户输入prompt到llm输出答案的流程原理

开发基于提示工程的大语言模型（LLM）应用——学习笔记

《AI大模型开发笔记》——提示词工程

[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案

GitHub每日最火火火项目（2.28）

GitHub 星标10W+的大模型书籍：《轻松入门大模型应用开发：GPT-4 和 ChatGPT 实战指南》，25年一书通关LLM大模型

大模型研究：DeepSeek三个版本（初级中级高级）资源要求说明

Open WebUI：开源AI交互平台的全面解析

一文看懂 Claude 3.7 Sonnet，为什么是第一个融合推理模式的 AI 模型

【llm对话系统】大模型源码分析之 LLaMA 模型的 Masked Attention

饿了么算法工程师-AIGC岗内推

2025年，值得关注的LLM大趋势

DeepSeek掘金——DeepSeek R1架构和训练过程图解

大模型调优方法：提示工程、RAGs 与微调对比

【有啥问啥】深入了解 FlashMLA：Hopper GPU 的高效 MLA 解码内核

DeepSeek R1 简单指南：架构、训练、本地部署和硬件要求

Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路

GPT-4提示词冠军如何写 prompt：CO-STAR 框架、文本分段、系统提示

游戏语音趋势解析，社交互动有助于营造沉浸式体验

大模型替代程序猿？不可能，绝对不可能！进化路线来了来！！！

通过vLLM部署LLM模型到生产环境中

UnionLLM——通过统一接口调用国内外所有LLM的Python开源工具包

手把手教你用Docker部署Dify平台，打造可视化LLM应用环境

微调 LLM （RLHF + DPO）

让 LLM 来评判 | 设计你自己的评估 prompt

探索 LangChain: 架构、组件和应用

大数据最全大模型入门到应用——LangChain：索引（Indexes）-[文本分割器

大模型入门到应用——LangChain：索引（Indexes）-[文本分割器(2)

LangChain：Models、Prompts、Indexes、Memory、Chains、Agents。MaxKB

自编大模型系列之 01 使用 Python 从头构建 LLaMA 3 编写您自己的十亿参数LLM（教程含源码）

基于OneAPI+ChatGLM3-6B+FastGPT搭建LLM大语言模型知识库问答系统

大语言模型(LLM)入门学习路线图，附资源汇总，收藏这篇就够了

LLMs之ReACT-Agent：ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让LLM稳定输出JSON格式数据)之详细攻略

【Python大语言模型系列】如何在LangChain中使用ReAct构建AI Agent（案例+源码）

GGUF 文件格式全解析

ThinkJSON:通过强化学习让大型语言模型（LLM）严格遵守JSON模式

全面分析 DeepSeek 的新开源 FlashMLA

Google搜索免费API访问

DeepSeep开源周，第三天：DeepGEMM是啥？

推荐：LangChain — 构建情境感知推理应用的利器

LangChain 核心概念与架构详解