LLm 第6页

“大语言模型微调”（Fine-tuning）与“大语言模型应用”（LLM Applications）之间的区别

1.概念与定义大语言模型微调微调指的是在一个经过大规模预训练的通用语言模型基础上，利用针对性较强的小规模数据集对模型进行进一步训练，从而使模型在特定领域或任务上表现得更优秀。目标：使模型更好地适应特定任务（如医疗问答、法律咨询、编程辅助等），提高准确性和专业性。方法：可以是全参数微调，也可以采用参数高效微调（如LoRA、Adapter、PrefixTuning等），后者只调整部分参数而保持原有权重

AI Echoes·2025-03-11 09:06

【大模型开发】大模型背后的基础组件与生态概览

支撑大模型开发与部署的关键组件与生态系统当今大模型（LLM,LargeLanguageModel）在工业与学术界的应用日益广泛，从ChatGPT、BERT到DeepSeek等新兴模型，背后离不开一整套成熟的技术生态和工具链支持

云博士的AI课堂·2025-03-11 08:56

LangChain 发布政策详解

技术背景介绍LangChain是一个用于构建和部署大型语言模型（LLM）应用的生态系统。

VYSAHF·2025-03-11 08:25

领域大模型之微调技术和最佳实践

在本指南中，您将了解LLM架构、微调过程以及如何为NLP任务微调自己的预训练模型。-介绍-大型语言模型（LLM）的特别之处可以概括为两个关键词——大型和通用。

程序员莫玛·2025-03-11 07:17

LangChain大模型应用开发指南-大模型Memory不止于对话

【一一AGI大模型学习所有资源获取处一一】①人工智能/大模型学习路线②AI产品经理资源合集③200本大模型PDF书籍④超详细海量大模型实战项目⑤LLM大模型系统学习

喝不喝奶茶丫·2025-03-11 06:45

如何对大模型进行微调？从原理到实战全解析

随着大语言模型（LLM）的快速发展，微调（Fine-tuning）已成为将通用模型转化为垂直领域专家的核心技术。

挣扎与觉醒中的技术人·2025-03-11 05:32

【RAG 论文】Program-of-Thoughts（PoT）提示：让 LLM 生成 Python 代码来解决复杂的数字计算问题

论文：ProgramofThoughtsPrompting:DisentanglingComputationfromReasoningforNumericalReasoningTasks⭐⭐⭐⭐TMLR2023Code：Program-of-Thoughts|GitHub论文速读文章提出了PoTPrompting方法，PoT可以看作是CoT（Chain-of-Thoughts）的改进，该方法通过生

yubinCloud·2025-03-11 03:12

LLM论文笔记 20: How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning

Arxiv日期：2024.5.16机构：IIT关键词CoT本质LLM推理本质核心结论1.CoT推理的功能组件尽管不同阶段的推理任务具有不同的推理需求，模型内部的功能组件几乎是相同的（共享而非独享）不同的神经算法实际上是由类似归纳头

Zhouqi_Hua·2025-03-11 03:10

《ChatGPT Prompt Engineering for Developers》课程-提示词原则

编写Prompt的原则本章的主要内容为编写Prompt的原则，在本章中，我们将给出两个编写Prompt的原则与一些相关的策略，你将练习基于这两个原则来编写有效的Prompt，从而便捷而有效地使用LLM。

evil-tomato·2025-03-11 02:09

如何添加示例到提示中进行查询分析

在我们的查询分析变得越来越复杂时，LLM（大型语言模型）可能难以理解在某些场景下到底应该如何响应。为了提升性能，我们可以在提示中添加示例来指导LLM。

dgay_hua·2025-03-11 02:39

LLM Weekly（2025.02.17-02.23）

本文是LLM系列文章，主要是针对2025.02.17-02.23这一周的LLM相关新闻与文章、GitHub资源分享。网络新闻Grok3Beta——推理代理的时代。

UnknownBody·2025-03-11 01:59

大语言模型(LLM)入门学习路线图，从零基础到精通，理论与实践结合的最佳路径！

Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。

ai大模型应用开发·2025-03-10 22:39

大模型好书推荐 -挖到宝了，500页RAG神书几乎把RAG讲得透透的

《基于大模型的RAG应用开发与优化——构建企业级LLM应用》是一本专注于RAG（Retrieval-AugmentedGeneration，检索增强生成）技术应用的书籍。

脱泥不tony·2025-03-10 14:07

大模型系列——Spring AI Advisor 指南

我们正在广泛实现各种RAG应用和提示API，并使用LLM创建令人印象深刻的项目。借助SpringAI，我们可以更快、更稳定地完成这些任务。

猫猫姐·2025-03-10 14:06

Spark-TTS：基于大模型的文本语音合成工具

GitHub：https://github.com/SparkAudio/Spark-TTSSpark-TTS是一个先进的文本到语音系统，它利用大型语言模型（LLM）的强大功能进行高度准确和自然的语音合成

CITY_OF_MO_GY·2025-03-10 13:35

Claude更新王炸功能：一键生成、评估、优化提示词！

类似地，要想让LLM模型或生成式AI工具更好的为你服务，你得先学会“写提示词”。提示词就是敲开AI大门的那把钥匙，相同的任务目标，不同的提示词得到的结果可能截然不同。

AI信息Gap·2025-03-10 10:46

Process-based Self-Rewarding Language Models 论文简介

基于过程的自奖励语言模型：LLM优化的新范式引言大型语言模型（LLM）在多种任务中展现出了强大的能力，尤其是在使用人工标注的偏好数据进行训练时。

ZHOU_CAMP·2025-03-10 08:31

Prompt Engineering 指南

但是大预言模型（LLM）的作用不仅于此，使用它构建业务系统或者给业务系统赋能的能力现阶段还未完全开发出来，我相信在不久之后，尤其是国产LLM成熟、相关监管法规落实之后，

陈小龙丶呐喊·2025-03-10 06:16

【OpenAI官方课程】第一课：GPT-Prompt 的构建原则指南

本课程将教您如何通过OpenAIAPI有效地利用大型语言模型（LLM）来创建强大的应用程序。

euffylee·2025-03-10 06:12

如何高效使用LangChain实现复杂任务：全面功能指南

LangChain是一个强大的工具集，它为开发基于大语言模型(LLM)的应用提供了丰富的组件和功能支持。

shuoac·2025-03-10 04:00

什么是MCP协议？AI Agent时代如何选择MCP协议？

摘要在人工智能（AI）迅猛发展的今天，如何让大型语言模型（LLM）充分利用外部数据和工具已成为关键问题。

猫头虎·2025-03-10 04:29

使用LangChain构建大语言模型(LLM)应用程序: 基础入门

使用LangChain构建大语言模型(LLM)应用程序:基础入门在这个教程中，我们将了解如何使用LangChain快速上手并构建一个基本的大语言模型(LLM)应用。

bavDHAUO·2025-03-10 04:57

使用LangChain构建简单的LLM应用

在这篇快速入门教程中，我们将向您展示如何使用LangChain构建一个简单的LLM（大型语言模型）应用程序。

fgayif·2025-03-10 02:12

《DeepSeek+Langchain落地实操:RAG知识增强检索和智能体实战开发》

它的设计理念在于简化和加速利用大型语言模型（LLM）和对话模型构建应用程序的过程。这个框架提供了一套全面的工具、组件和接口，旨在简化基于大型语言模型和对话模型的应用程序开发过程。

AI周红伟·2025-03-09 21:25

【简单记录】RAG与LLM的交互流程

一、流程名称该流程旨在通过结合用户查询、相关知识源和大型语言模型（LLM），生成一个增强上下文的文本响应。

努力努力再努力呐·2025-03-09 19:14

Manus：通用型Agent的技术革新与多元应用场景

其核心理念独树一帜，旨在为大语言模型（LLM）赋予“手”的能力，使其借助工具调用与任务执行，将抽象知识转化为切实可行的实际操作，开启人工智能应用的崭新时代。

蚂蚁质量·2025-03-09 16:16

【论文阅读】LayoutPrompter: Awaken the Design Ability of Large Language Models

本文提出Layout-Prompter，利用大型语言模型(llm)通过上下文学习来解决上述问题。LayoutPr

进击的乔洋·2025-03-09 16:40

大规模语言模型构建流程

大规模语言模型1.大语言模型大规模语言模型（LargeLanguageModels，LLM），也称大语言模型，是一种由包含数百亿以上参数的深度神经网络构建的语言模型，通常使用自监督学习方法通过大量无标注文本进行训练

人工智能技术笔记·2025-03-09 15:34

LLM时代的小模型思考：《What is the Role of Small Models in the LLM Era: A Survey》论文笔记

ImperialCollegeLondonAbstract问题：扩大模型大小会导致计算成本和能耗呈指数级增长，这使得这些模型对于学术研究人员和资源有限的企业来说不切实际小型模型（SMs）经常用于实际环境中，引发了关于小模型在LLM

FrancisQiu·2025-03-09 14:02

OpenManus：快速复刻Manus项目的技术路径与实施策略

这种设计使得复刻项目时能够快速剥离非必要模块，例如：模块替换：通过修改config.toml的llm配置段，可在1小时内完成从GPT-4到Claude3的模型切换功能裁剪：删除vision模块相关代码及配置项即可实现

花生糖@·2025-03-09 12:15

【快速入门】本地知识库部署：FastGPT与Dify轻松上手全指南！

本文主要内容本地部署Dify、FastGPT、OllamaDify、FastGPT对接一些目前免费的LLM大语言AI模型Dify、FastGPT对接Ollama本地模型大家好，我是一名喜欢在家折腾本地部署的开发者

大模型老炮·2025-03-09 11:33

LLM大模型安全概述

引言2022年底以来，以ChatGPT为代表的大模型飞速发展，正在成为#驱动新质生产力发展#的新动能、人类探索未知的新工具.在显著提升人工智能(artificialintelligence,AI)模型通用理解和生成能力的同时，也带来了前所未有的安全风险.大模型的能力与风险生成式大模型因其强大的智能能力和巨大的应用潜力吸引了众多研究者和企业的关注.从智能能力的角度来看，研究人员观测到：当训练数据和参

LLM教程·2025-03-09 06:06

在 VSCode 中本地运行 DeepSeek，打造强大的私人 AI

步骤1：在VSCode中安装Ollama和CodeGPT要在本地运行DeepSeek，我们首先需要安装Ollama，它允许我们在我们的机器上运行LLM，以及CodeGPT，它是集成这些模型以提供编码辅助的

csdn_aspnet·2025-03-08 23:19

大模型RAG入门到实战基础教程（非常详细），大模型RAG入门到精通，收藏这一篇就够了！

写在前面大模型（LargeLanguageModel，LLM）的浪潮已经席卷了几乎各行业，但当涉及到专业场景或行业细分域时，通用大模型就会面临专业知识不足的问题。

AI程序猿人·2025-03-08 18:56

研究发现，LLM基于数据的内在含义进行表示，并以其主导语言推理

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/【本周AI新闻:Deepseek崛起背后：AI智能代理时代正式到来？】https://w

新加坡内哥谈技术·2025-03-08 16:21

解锁 Hugging Face 的 smolagents：AI 代理的革命性突破！

AI代理的崛起随着大型语言模型（LLM）推理能力的增强，AI代理成为了当前最热门的话题。这些代理不仅能够独立做出决策，还能根据用户输入执行任务。

真智AI·2025-03-08 13:27

Ollama：让大型语言模型触手可及

Ollama：让大型语言模型触手可及导语：近年来，大型语言模型（LLM）发展迅猛，但对于普通用户而言，搭建和使用LLM仍有一定门槛。

步子哥·2025-03-08 12:15

DeepSeek掘金——vLLM和ollama综合对比

欢迎来到我们深入研究LLM推理框架的最后一部分！在第一部分和第二部分中，我们分别探讨了Ollama和vLLM，了解了它们的架构、功能和基本性能特征。

不二人生·2025-03-08 10:12

打卡代码随想录第17天：LeetCode654.最大二叉树、 617.合并二叉树、 700.二叉搜索树中的搜索、98.验证二叉搜索树

学习资料：代码随想录文中含LLM生成内容，不一定对654.最大二叉树力扣题目地址思路：不断寻找该部分的最大值去切割数组，不断递归，到在左闭右开区间不成立时，返回空节点。

jingjingjing1111·2025-03-08 07:26

打卡代码随想录第15天：LeetCode 110.平衡二叉树 257. 二叉树的所有路径 404.左叶子之和

学习资料：代码随想录文中含LLM生成内容110.平衡二叉树力扣题目链接思路：逐层返回当前节点的最大高度，比较各节点的左右孩子高度后续方法遍历，因为‘中’是比较环节，要在左右之后/***Definitionforabinarytreenode

jingjingjing1111·2025-03-08 07:24

打卡代码随想录算法训练营第11天： 150. 逆波兰表达式求值 239. 滑动窗口最大值 347.前 K 个高频元素

代码随想录文中含LLM回答内容150.逆波兰表达式求值力扣题目链接思路K:先理解逆波兰表达式是啥，是把运算符放在了两个要运算的数字的后边，又叫后缀表达式。

jingjingjing1111·2025-03-08 07:51

山海鲸接入DeepSeek~赋予AI 3D感知“超能力”

山海鲸震撼升级，一键直连DeepSeek、通义千问等主流大模型，融合前沿3D-LLM算法，赋予AI3D感知“超能力”，让数字孪生生产力全面爆发，开启无限可能！

山海鲸可视化·2025-03-08 06:03

NL2SQL技术方案系列(5)：金融领域NL2SQL技术方案以及行业案例实战讲解3--非LLM技术方案

NL2SQL技术方案系列(5)：金融领域NL2SQL技术方案以及行业案例实战讲解3NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL

汀、人工智能·2025-03-08 03:00

NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择；LLM选型与Prompt工程技巧，揭秘项目落地优化之道

NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择；LLM选型与Prompt工程技巧，揭秘项目落地优化之道NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD

汀、人工智能·2025-03-08 03:59

NL2SQL进阶系列(2)：DAIL-SQL、DB-GPT开源应用实践详解[Text2SQL]

NL2SQL进阶系列(2)：DAIL-SQL、DB-GPT开源应用实践详解[Text2SQL]NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析

汀、人工智能·2025-03-08 03:58

Spring AI简单使用

Java大模型应用开发，微服务整合DeepSeek，LangChain大型语言模型LLM实战-尚硅谷文

NaughtyBo·2025-03-08 01:40

CentOS 7中安装Dify

Dify是一个开源的LLM应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等，让您可以快速从原型到生产。

laolitou_1024·2025-03-07 22:04

Agentic Security：开源LLM漏洞扫描器

AgenticSecurity：开源LLM漏洞扫描器项目地址:https://gitcode.com/gh_mirrors/ag/agentic_security项目介绍AgenticSecurity是一款开源的大型语言模型

袁立春Spencer·2025-03-07 13:06

LLM辅助编程：代码自动生成与优化

LLM,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化，程序员面临着越来越高的开发压力和效率要求。

AI智能涌现深度研究·2025-03-07 05:54

【大模型技术】LlamaFactory 的原理解析与应用

LlamaFactory是一个基于LLaMA系列模型（如LLaMA、LLaMA2、Vicuna等）的开源框架，旨在帮助开发者和研究人员快速实现大语言模型（LLM,LargeLanguageModel）的微调

大数据追光猿·2025-03-07 00:32

推荐频道

LLm