LLM 第6页

【AI论文】超越80/20规则：高熵少数令牌驱动LLM推理的有效强化学习

摘要：具有可验证奖励的强化学习（RLVR）已经成为一种增强大型语言模型（LLM）推理能力的强大方法，但其机制尚未得到很好的理解。

东临碣石82·2025-06-06 22:49

LLM多平台统一调用系统-LiteLLM概述

概述在当今快速发展的AI领域，大语言模型(LLM)已成为技术创新的核心驱动力。

一铭·2025-06-06 16:43

MCP协议在LLM系统中的架构与实现原理研究

MCP协议的角色和功能定位模型上下文协议（ModelContextProtocol,MCP）是由Anthropic公司（Claude模型的发布方）提出的一种开放协议，旨在标准化大型语言模型（LLM）与外部数据源

ImNIk·2025-06-06 11:38

【AI大模型通关秘籍】我的提示词工程19式进阶笔记 (萌新也能懂的保姆级教程)

自从一脚踏入大语言模型（LLM）这个神奇的世界，我就像打开了新世界的大门，每天都被它的强大所震撼。但同时，我也曾困惑于如何与这个“最强大脑”更好地沟通，让它真正为我所用。

昨日嘉靖(学习LLM版)·2025-06-06 10:03

RAG入门之数据导入

LangChain是什么LangChain是一个用于构建基于大语言模型（LLM）应用的开源框架。它提供了一套工具和抽象，让开发者能够轻松构建复杂的AI应用。

·2025-06-06 10:49

LLM 提示词大赛冠军 Co-STAR 模型

CO-STAR模型根据新加坡提示工程大赛的获胜框架CO-STAR,来构建完整和有效的提示词:-C-Context(清楚的背景信息)-O-Objective(明确的目标设定)-S-Style(生成文字的风格)-T-Tone(生成文字的语调)-A-Audience(目标受众的描述)-R-Response(回应的类型,如表格、段落数量等)具体的构建方法是这样的首先，我提供了一个我经营的背景。接着，我设定

修昔底德·2025-06-06 08:42

【论文解读】MemGPT: 迈向为操作系统的LLM

1stauthor:CharlesPackerpaperMemGPT[2310.08560]MemGPT:TowardsLLMsasOperatingSystemscode:letta-ai/letta:Letta(formerlyMemGPT)isthestatefulagentsframeworkwithmemory,reasoning,andcontextmanagement.这个项目现在已

vlln·2025-06-06 07:07

从零教你做一个mcp服务端和客户端，真正理解什么是mcp（保姆级教程+代码），智能体和大模型的高效落地就靠mcp了。

无数开发者在探索如何让AI模型（比如LLM）更智能、更高效地与外部世界互动时，都遇到了瓶颈。传统的API调用方式，往往显得笨拙、低效，甚至有点“智障”。但是，想象一下…

AI人工智能时代·2025-06-06 02:08

大语言模型学习笔记

一、大型语言模型（LLM）概念1、LLM定义、特点、核心：处理海量文本，多者可以具备数百亿参数，理解语言深度，展现涌现能力它的核心是注意力机制：通过注意力机制，transformer能够聚焦于输入序列中的重要部分

wyzgq0515·2025-06-05 10:21

【学习笔记6】论文SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy

AbstractText-to-SQL转换是一项关键创新，简化了从复杂SQL语句到直观自然语言查询的转换，尤其在SQL在各类岗位中广泛应用的情况下，这一创新显得尤为重要。随着GPT-3.5和GPT-4等大型语言模型（LLMs）的兴起，这一领域得到了极大的推动，提供了更好的自然语言理解能力和生成细致入微的SQL语句的能力。然而，在Text-to-SQL应用中，开源LLMs的潜力尚未得到充分挖掘，许多

||Φ|(|T|Д|T|)|Φ||/·2025-06-05 07:59

[论文阅读笔记] Learning Transferable Visual Models From Natural Language Supervision

Abstract将LLM带来的语言zero-shot能力扩展到图像领域，让图像pretrain不再局限于由数据集定义的类别，从而大幅度提升在downstream任务zero-shot的精度。

Heartache Doctor·2025-06-05 07:28

【大模型入门指南 10】大模型推理部署：vLLM和llama.cpp

【大模型入门指南】系列文章：【大模型入门指南01】深度学习入门【大模型入门指南02】LLM大模型基础知识【大模型入门指南03】提示词工程【大模型入门指南04】Transformer结构【大模型入门指南05

青松ᵃⁱ·2025-06-05 06:18

OpenAI ChatGPT 与 Google Gemini 特性深度对比分析

最近，ChatGPT和Gemini一直是LLM的主要话题，并且有很多关于它们功能的比较。在本文中，我们比较了该领域的两个领先者：OpenAI的ChatGPT和GoogleGemini。

KompasAI·2025-06-05 05:15

RAG架构中用到的模型学习思考

前言RAG（Retrieval-AugmentedGeneration，检索增强生成）架构结合了检索和生成能力，通过引入外部知识库来提升大语言模型（LLM）的回答准确性和可靠性。

勤奋的知更鸟·2025-06-05 05:40

AI系统提示词：Grok 3 Chat Assistant

系统提示词的作用与意义在大型对话模型（LLM）中，系统提示词（SystemPrompt）相当于为AI设定的“行为准则”与“角色定位说明”，决定了模型在具体交互场景下的身份设定、可用工具、回答策略与限制条件

德育处主任Pro·2025-06-04 22:45

【AI News | 20250331】每日AI进展

AIRepos1、MCP-Chinese-Getting-Started-Guide模型上下文协议（MCP）是一个创新的开源协议，旨在标准化大语言模型（LLM）与外部数据源及工具的连接方式，类似AI应用的

三道杠卷胡·2025-06-04 15:22

WeClone项目v0.1.2版本发布：声音克隆与聊天机器人集成

数字克隆/数字分身/LLM/大语言模型/微信聊天机器人/LoRA项目地址:https://gitcode.com/gh_mirrors/we/WeCloneWeClone是一个专注于AI克隆技术的开源项目

单盼晔·2025-06-04 13:07

一文看懂 MCP 大模型架构：从事件驱动到智能涌现，全链路实战解构！

）：1、认知迭代：认知智能体在流程自动化、决策辅助等领域的颠覆性2、场景淬炼：通过“需求探矿-场景验证-价值量化”三阶模型3、工程落地：构建Agent的完整技术栈企业要真正跑通“大模型”，不是单靠一个LLM

AI大模型-小涂·2025-06-04 12:28

Spring AI系列之使用 Mistral AI API 实现函数调用

1.概述利用大型语言模型(LLM)，我们可以检索大量有用的信息。我们可以学习关于任何事物的许多新知识，并基于互联网上已有的数据获得答案。我们可以让它们处理输入数据并执行各种操作。

@@@八爪鱼·2025-06-04 08:56

【大模型技术】怎么用agent和prompt工程实现用户的要求？

使用Agent和Prompt工程是实现用户需求的一种强大方法，尤其是在基于大语言模型（LLM）的应用中。以下是一个详细的步骤指南，帮助您理解如何结合Agent和Prompt工程来满足用户的需求。

大数据追光猿·2025-06-04 05:30

Prompt提示工程上手指南:基础原理及实践(四)-检索增强生成(RAG)策略下的Prompt

前言此篇文章已经是本系列的第四篇文章，意味着我们已经进入了Prompt工程的深水区，掌握的知识和技术都在不断提高，对于Prompt的技巧策略也不能只局限于局部运用而要适应LLM大模型的整体框架去进行改进休整

fanstuck·2025-06-04 04:59

【大模型框架】LLM大模型开源RAG框架汇总

前言本文搜集了一些开源的基于LLM的RAG（Retrieval-AugmentedGeneration）框架，旨在吸纳业界最新的RAG应用方法与思路。

RAG知识库·2025-06-04 00:29

模块化设计：构建可扩展的LLM应用架构

引言模块化设计与LLM应用架构概述在当今信息技术飞速发展的时代，人工智能（AI）技术的进步尤为引人注目。

AI天才研究院·2025-06-03 23:48

从零开始构建LLM智能代理:基础架构和关键组件

从零开始构建LLM智能代理:基础架构和关键组件作者：禅与计算机程序设计艺术1.背景介绍1.1LLM智能代理的兴起近年来，大型语言模型（LLM）在自然语言处理领域取得了显著的进展，展现出惊人的文本生成、理解和推理能力

AI智能应用·2025-06-03 22:48

大语言模型(LLM)入门 - (2) 模型构建

文章来自：大语言模型(LLM)小白入门自学项目-TiaoYu-1GitHub-tiaoyu1122/TiaoYu-1:ForPeople!ForFreedom!ForPeople!

小鸡吃石子·2025-06-03 18:47

大语言模型(LLM)入门 - (18) 梯度消失与梯度爆炸

文章来自：大语言模型(LLM)小白入门自学项目-TiaoYu-1GitHub-tiaoyu1122/TiaoYu-1:ForPeople!ForFreedom!ForPeople!

小鸡吃石子·2025-06-03 18:47

大语言模型(LLM)入门 - (20) 人类反馈强化学习

文章来自：大语言模型(LLM)小白入门自学项目-TiaoYu-1GitHub-tiaoyu1122/TiaoYu-1:ForPeople!ForFreedom!ForPeople!

小鸡吃石子·2025-06-03 18:47

大语言模型(LLM)入门 - (1) 相关概念

文章来自：大语言模型(LLM)小白入门自学项目-TiaoYu-1GitHub-tiaoyu1122/TiaoYu-1:ForPeople!ForFreedom!ForPeople!

小鸡吃石子·2025-06-03 18:13

AiPy自动化数学题生成实战，修复表弟暑假“太闲.bug”

官方网站：https://www.aipyaipy.com/AiPy是知道创宇发布的开源框架，是一款融合LLM与Python生态的自动化工具平台，以“Python-Use”范式重新定义AI任务执

·2025-06-03 17:56

大模型、AI人工智能：核心技术与发展趋势

引言近年来，人工智能（AI）技术迅猛发展，尤其是大语言模型（LLM）如ChatGPT、DeepSeek、Claude等的崛起，正在改变我们的生活和工作方式。

milk_yan·2025-06-03 17:04

深入学习LLM开发第十九章：模型服务化开发（FastAPI集成与异步处理）

针对下面的文章形成一个封面的文生图提示词，要求能体现出LangServe、FastAPI，要求具备科技感基于LangChain与FastAPI的模型服务化开发方案一、技术架构概述LangChain是一个专为大语言模型(LLM

沙子可可·2025-06-03 14:18

LightRAG vs GraphRAG：两种RAG系统实体与关系提取提示机制的深度比较

概述LightRAG实体与关系提取提示GraphRAG实体与关系提取提示深度对比分析提示设计复杂度功能覆盖与输出格式可定制性与扩展性性能与成本考量场景适用性与选型建议结论与展望引言随着大规模语言模型（LLM

gs80140·2025-06-03 12:34

AI Agent工程实践：从提示词到自主智能

AIAgent技术——工程侧的应用与提示词设计从工程和应用的视角看，AIAgent不再仅仅是一个抽象概念，它是一套通过精心设计的提示词（PromptEngineering）和外部执行框架，将大型语言模型（LLM

由数入道·2025-06-03 11:26

在本地基于deepseek和Dify平台构建私有化知识库平台

Dify开源的LLM应用开发平台，提供可视化界面和API集成能

勤奋的知更鸟·2025-06-03 03:31

RAGFlow从理论到实战的检索增强生成指南

六、未来展望：RAGFlow的进化方向前言在AI大模型时代，如何让LLM（大型语言模型）摆脱“幻觉”并输出可信内容？答案藏在RAG（检索增强生成）技术中

勤奋的知更鸟·2025-06-03 03:01

认识GraphRAG

GraphRAG（Graph-basedRetrieval-AugmentedGeneration）是微软提出的新一代检索增强生成技术，其核心创新在于将知识图谱与大语言模型（LLM）深度融合，突破传统RAG

勤奋的知更鸟·2025-06-03 03:01

自动驾驶大模型---小米&华科的ORION端到端方案

背景关于大模型/端到端，笔者也已经写了一个系列，其中主要包括以下几篇（持续更新）：《大模型---DeepseekLLM大语言模型原理》《大模型---一文看懂视觉语言大模型VLM》《大模型实战---人人都可以部署LLM

智能汽车人·2025-06-03 03:30

FlashAttention（flash_attn）的高效注意力机制实现库学习，与 torch.nn.MultiheadAttention 在数学上是完全相同

它通过减少显存占用和加速计算，显著提升大模型（如LLM、视觉Transformer）的训练和推理效率。

Hali_Botebie·2025-06-03 00:09

大语言模型生成式AI学习笔记——2. 1.4LLM指令微调——多任务指令微调

Multi-taskinstructionfine-tuning（多任务指令微调）Multitaskfine-tuningisanextensionofsingletaskfine-tuning,wherethetrainingdatasetiscomprisedofexampleinputsandoutputsformultipletasks.Here,thedatasetcontainsexa

预见未来to50·2025-06-02 23:57

AI Agent: AI的下一个风口大模型时代狂飙猛进

自2017年以来,transformer模型的出现,以及大规模语言模型(LLM)和多模态模型的兴起,极大地推动了AI的发展。

AI天才研究院·2025-06-02 20:38

LLM的工作原理详解

文章目录1.LLM的核心概念1.1什么是token？

我就是全世界·2025-06-02 18:22

本地模型＋MCP实践

可以参考实现本地模型的部署或者是使用其他方式文章链接:LMStudio本地部署大模型-CSDN博客什么是MCPMCP（ModelContextProtocol，模型上下文协议）是由Anthropic公司推出的开放标准协议，旨在为大型语言模型（LLM

t梧桐树t·2025-06-02 15:32

本地部署dify+ragflow+deepseek ,结合小模型实现故障预测，并结合本地知识库和大模型给出维修建议

Dify则旨在降低大型语言模型（LLM）应用开发的门槛，提供低代码甚至无代码的开发体验，适合快速构建和部署多种AI应用。因此文档处

算法小菜鸟成长心得·2025-06-02 15:00

Svelte 5 在跨平台 AI 阅读助手中的实践：轻量化前端架构的极致性能优化

作为一个典型的前端开发者，去年在为公司调研Rust前端工具链、LLM应用开发技术体系的时候，对这类技术领域产生了浓厚的兴趣，也是出于早期曾经是一名Android移动应用个人开发者角色的经历，习惯性的给自己设定了一个工具主题的产品

Sopaco·2025-06-02 13:48

如何利用大语言模型生成特定格式文风的报告类文章

在这个算法渗透万物的时代，我们不再仅仅满足于大语言模型（LLM）能“写”，更追求它能“写出精髓，写出风格”。

由数入道·2025-06-02 03:36

BitNet：让1-bit大语言模型飞速运转

这就是我们现代大语言模型（LLM）面对的挑战：它们需要处理海量的文本数据，并且要尽可能快地理解、生成并输出语言。传统的LLM，就像拿着一支粉笔在黑板上拼命书写的老师，虽然效率不低，但总有点力不从心。

步子哥·2025-06-02 02:29

它包括一个成熟的全文搜索引擎、矢量数据库、LLM界面和更多实用程序

它包括一个成熟的全文搜索引擎、矢量数据库、LLM具有行动计划和推理功能的接口、用于根据数据编写和运行您自己的自定义代理的JavaScript运行时，以及更多实用程序。

struggle2025·2025-06-01 23:08

源码解析（一）：GraphRAG

原文技术博客GraphRAG是一种结构化的、分层的检索增强生成(RAG)方法，它利用知识图谱来增强LLM的输出，用于推理私有数据集中的复杂信息。

汪汪汪侠客·2025-06-01 21:51

Spring Ai 从Demo到搭建套壳项目（一）初识与实现与deepseek对话模式

前言为什么说Java长青，主要是因为其生态圈完善，Spring又做了一款脚手架，把对接各个LLM厂商的sdk做了一遍，形成一系列的spring-ai-starter-**的依赖。

·2025-06-01 20:56

推理模型与普通模型的思考逻辑到底有什么不一样

1.推理模型：AI界的“思考者”1.1从蒙眼猜拳到步步为营传统LLM像是蒙着眼睛的拳击手，输入问题后直接挥拳（输出答案），可能一击制胜也可能打偏。

TGITCIC·2025-06-01 20:13

推荐频道

LLM

【AI论文】超越80/20规则：高熵少数令牌驱动LLM推理的有效强化学习

LLM多平台统一调用系统-LiteLLM概述

MCP协议在LLM系统中的架构与实现原理研究

【AI大模型通关秘籍】我的提示词工程19式进阶笔记 (萌新也能懂的保姆级教程)

RAG入门之数据导入

LLM 提示词大赛冠军 Co-STAR 模型

【论文解读】MemGPT: 迈向为操作系统的LLM

从零教你做一个mcp服务端和客户端，真正理解什么是mcp（保姆级教程+代码），智能体和大模型的高效落地就靠mcp了。

大语言模型学习笔记

【学习笔记6】论文SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy

[论文阅读笔记] Learning Transferable Visual Models From Natural Language Supervision

【大模型入门指南 10】大模型推理部署：vLLM和llama.cpp

OpenAI ChatGPT 与 Google Gemini 特性深度对比分析

RAG架构中用到的模型学习思考

AI系统提示词：Grok 3 Chat Assistant

【AI News | 20250331】每日AI进展

WeClone项目v0.1.2版本发布：声音克隆与聊天机器人集成

一文看懂 MCP 大模型架构：从事件驱动到智能涌现，全链路实战解构！

Spring AI系列之使用 Mistral AI API 实现函数调用

【大模型技术】怎么用agent和prompt工程实现用户的要求？

Prompt提示工程上手指南:基础原理及实践(四)-检索增强生成(RAG)策略下的Prompt

【大模型框架】LLM大模型开源RAG框架汇总

模块化设计：构建可扩展的LLM应用架构

从零开始构建LLM智能代理:基础架构和关键组件

大语言模型(LLM)入门 - (2) 模型构建

大语言模型(LLM)入门 - (18) 梯度消失与梯度爆炸

大语言模型(LLM)入门 - (20) 人类反馈强化学习

大语言模型(LLM)入门 - (1) 相关概念

AiPy自动化数学题生成实战，修复表弟暑假“太闲.bug”

大模型、AI人工智能：核心技术与发展趋势

深入学习LLM开发 第十九章：模型服务化开发（FastAPI集成与异步处理）

LightRAG vs GraphRAG：两种RAG系统实体与关系提取提示机制的深度比较

AI Agent工程实践：从提示词到自主智能

在本地基于deepseek和Dify平台构建私有化知识库平台

RAGFlow从理论到实战的检索增强生成指南

认识GraphRAG

自动驾驶大模型---小米&华科的ORION端到端方案

FlashAttention（flash_attn） 的高效注意力机制实现库学习，与 torch.nn.MultiheadAttention 在数学上是完全相同

大语言模型生成式AI学习笔记——2. 1.4LLM指令微调——多任务指令微调

AI Agent: AI的下一个风口 大模型时代狂飙猛进

LLM的工作原理详解

本地模型＋MCP实践

本地部署dify+ragflow+deepseek ,结合小模型实现故障预测，并结合本地知识库和大模型给出维修建议

Svelte 5 在跨平台 AI 阅读助手中的实践：轻量化前端架构的极致性能优化

如何利用大语言模型生成特定格式文风的报告类文章

BitNet：让1-bit大语言模型飞速运转

它包括一个成熟的全文搜索引擎、矢量数据库、LLM界面和更多实用程序

源码解析（一）：GraphRAG

Spring Ai 从Demo到搭建套壳项目（一）初识与实现与deepseek对话模式

推理模型与普通模型的思考逻辑到底有什么不一样

深入学习LLM开发第十九章：模型服务化开发（FastAPI集成与异步处理）

FlashAttention（flash_attn）的高效注意力机制实现库学习，与 torch.nn.MultiheadAttention 在数学上是完全相同

AI Agent: AI的下一个风口大模型时代狂飙猛进