llm 第2页

Ubuntu 服务器Llama Factory 搭建DeepSeek-R1微调训练环境

1.首先了解一下什么是LLM微调LLM微调指的是在已经预训练好的大型语言模型基础上，使用特定的任务数据或领域数据，通过进一步的训练来调整模型的参数，使其在特定任务或领域上能够表现得更好。

大鱼>·2025-04-16 16:40

LangChain4j 工具调用详解：从基础到高级的实战指南

它允许LLM在必要时调用一个或多个可用的工具，这些工具通常由开发人员定义。工具可以是任何东西：网络搜索、调用外部API，或者执行一段特定的代码等。LLMs本身并不能实际调用工具；相反，它们会在响应

泰山AI·2025-04-16 16:37

Spring AI使用tool Calling和MCP

深入探索SpringAISpringAI版本1.0.0.M6在人工智能与软件开发深度融合的时代，SpringAI作为一个强大的框架，持续为开发者提供着高效且便捷的工具，以实现与大语言模型（LLM）的无缝交互

_沉浮_·2025-04-16 13:18

检索增强生成（RAG）：利用Python、LangChain和OpenAI实现前沿的自然语言处理技术

检索增强生成（RAG）：利用Python、LangChain和OpenAI实现前沿的自然语言处理技术引言在自然语言处理（NLP）的领域中，随着大型语言模型（LLM）的发展，我们已经见证了许多突破性的进展

m0_57781768·2025-04-16 09:25

【自动驾驶轨迹规划之大模型】

欢迎大家关注我的B站：偷吃薯片的Zheng同学的个人空间-偷吃薯片的Zheng同学个人主页-哔哩哔哩视频(bilibili.com)目录1.引入LLM的背景2.文章架构3.国内外研究现状4.方法本篇博客以

无意2121·2025-04-16 05:27

长上下文时代：RAG的块大小为何仍需克制？

一、技术矛盾：长与短的博弈1.1LLM的"长"与RAG的"短"当LLM的上下文窗口突破64K甚至128Ktokens时，开发者常陷入直觉误区——认为RAG的拆分块也应"同步升级"。

TGITCIC·2025-04-16 03:16

AI Agent开发大全第二十八课-MCP实现本地命令调用怎么做的？

当下的AIAgent特别是MCP以充当LLM的手和脚为趋势已经越来越多的在实际生活和工作中

TGITCIC·2025-04-16 03:14

Inference: Parallel LLM Generation via Concurrent Attention

推理：通过并发注意力实现并行LLM生成目录介绍顺序LLM生成的挑战Hogwild推理方法用于协作推理的缓存布局旋转位置嵌入协作提示实验结果涌现的协作行为局限性和未来方向结论介绍大型语言模型（LLM）彻底改变了自然语言处理

Alexguantp·2025-04-15 19:23

大语言模型的技术发展历程，从N-gram到DeepSeek-R1

介绍各个模型的思路和创新点，聚焦NLP经典模型和技术突破的理解，不深入数学推导过程前言根据整个自然语言处理NLP领域的技术发展，可以将其分为四个技术阶段：统计语言模型，神经网络模型，预训练语言模型PLM，大型语言模型LLM

TARO_ZERO·2025-04-15 18:18

MCP(模型上下文协议)保姆级教程实战篇(三)----MCP服务器端搭建

一、MCP服务器的概念MCP服务器（ModelContextProtocolServer）是一种轻量级程序，旨在将大型语言模型（LLM）与外部数据源和工具无缝集成。

菜鸟模型·2025-04-15 18:46

BERT - 直接调用transformers.BertModel, BertTokenizerAPI不进行任何微调

1.加载预训练模型和分词器fromtransformersimportBertTokenizer,BertModelmodel_path="/Users/azen/Desktop/llm/models/

风筝超冷·2025-04-15 17:13

centos-LLM-生物信息-BioGPT-使用1

参考：GitHub-microsoft/BioGPThttps://github.com/microsoft/BioGPTBioGPT：用于生物医学文本生成和挖掘的生成式预训练转换器|生物信息学简报|牛津学术—BioGPT:generativepre-trainedtransformerforbiomedicaltextgenerationandmining|BriefingsinBioinfor

淀粉肠狂热粉·2025-04-15 17:09

大模型RAG系列：什么是RAG？RAG是如何解决问题的？RAG的未来发展趋势！

一、什么是RAG所谓RAG，检索增强生成（RetrievalAugmentedGeneration），简称RAG，已经成为当前最火热的LLM应用方案。

大模型微调部署·2025-04-15 15:28

深度剖析现阶段的多模态大模型做不了医疗

导读在人工智能的这波浪潮中，以ChatGPT为首的大语言模型（LLM）不仅在自然语言处理（NLP）领域掀起了一场技术革命，更是在计算机视觉（CV）乃至多模态领域展现出了令人瞩目的潜力。

AI程序猿人·2025-04-15 15:27

从 0 到 1 构建高效 RAG 问答系统：LangChain+Ollama+Chroma 实战指南

一、引言：突破LLM知识边界的RAG技术在企业级AI应用中，大语言模型（LLM）常面临两大痛点：知识时效性不足（如训练数据截止到2023年）和领域知识缺失（如企业内部文档未被模型学习）。

佑瞻·2025-04-15 10:29

AI Agents新手入门到精通：从零开始，手把手教你打造自己的Agent！

今日主题：当什么是Agent，与LLM的区别又是啥这一天，你的女朋友问你（假设我们有女朋友），宝宝，什么是Agent啊，Agent和LLM有什么区别呀，最近大家都在说的Agent究竟是什么，包括很多文章都在写的

程序员辣条·2025-04-15 08:43

AI Agents新手指南：从零开始，打造属于自己的AI Agent！

今日主题：当什么是Agent，与LLM的区别又是啥这一天，你的女朋友问你（假设我们有女朋友），宝宝，什么是Agent啊，Agent和LLM有什么区别呀，最近大家都在说的Agent究竟是什么，包括很多文章都在写的

AI大模型-王哥·2025-04-15 08:41

MCP（Model Context Protocol，模型上下文协议）

MCP（ModelContextProtocol，模型上下文协议）是大语言模型领域由Anthropic公司于2024年11月推出的开放协议，旨在通过标准化接口实现LLM（大语言模型）与外部数据源、工具及服务的高效安全集成‌

C7211BA·2025-04-15 06:00

大语言模型应用指南：图像生成

近年来，随着深度学习技术的快速发展，基于大语言模型（LargeLanguageModel，LLM）的图像生成技术取得了突破性的进展。这些技术能够根据自然语言描述生成高质量的图像，为

AI智能涌现深度研究·2025-04-14 22:05

基于Qwen2/Lllama3等大模型，部署团队私有化RAG知识库系统的详细教程（Docker+AnythingLLM）

自ChatGPT发布以来，大型语言模型（LargeLanguageModel，LLM，大模型）得到了飞速发展，它在处理复杂任务、增强自然语言理解和生成类人文本等方面的能力让人惊叹，几乎各行各业均可从中获益

大耳朵爱学习·2025-04-14 19:11

这样的可观测数据平面让AI自动诊断故障

AI，特别是大模型（LLM）的崛起，为自动化故障诊断带来了新的曙光。然而，要充分释放AI在可观测性领域的潜力，我们需要一个全新的、为AI量身打造的数据平面。APO(

·2025-04-14 16:11

让 LLM 来评判 | 技巧与提示

这是让LLM来评判系列文章的第六篇，敬请关注系列文章:基础概念选择LLM评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示LLM评估模型已知偏差及缓解措施:缺乏内部一致性：同一

·2025-04-14 16:38

检索增强生成技术：让大模型回答更精准可靠

检索增强生成技术：让大模型回答更精准可靠一、技术原理深度剖析痛点定位：大模型的知识局限与质量失控当前大语言模型(LLM)在实际应用中面临两大核心痛点：知识局限性和回答质量不可控。

CodePatentMaster·2025-04-14 14:44

大型语言模型中的工具调用（Function Calling）技术详解

一、引言随着大型语言模型（LLM）能力的飞速发展，它们在自然语言理解、文本生成、对话交互等方面展现出了令人惊叹的表现。

大树~~·2025-04-14 14:41

提示词工程-Prompt Engineering

引言prompt（提示词）是我们和LLM互动最常用的方式，我们提供给LLM的Prompt作为模型的输入，并希望LLM反馈我们期待的结果。

苍墨穹天·2025-04-14 11:20

深入学习LLM开发第十四章：LangGraph介绍（上）

LangGraph是LangChain生态系统中的一个重要组件，专门用于构建和管理复杂的有状态、多步骤应用。它通过图形化编程的方式，帮助开发者设计、调试和执行包含循环、分支和状态转移的工作流程，尤其适合需要长期记忆和动态决策的AI应用场景。计划用三个章节进行介绍：第一部分介绍基本功能，第二部分介绍基于LangGraph的应用构建，第三部分介绍一些高级特性。本周是第一部分的内容（万字长文）。Lang

沙子可可·2025-04-14 09:41

大模型在边缘部署可行吗？一文解析边缘AI的落地路径

引言：边缘AI的热潮随着人工智能技术的不断突破，尤其是在大语言模型（LLM）、计算机视觉、语音识别等领域的广泛应用，越来越多的企业和开发者开始关注“边缘AI”的潜力。

moppol·2025-04-14 09:08

别再搞混了！MCP真的需要Function Calling吗？Cline源码揭秘

是不是一定要LLM具备FunctionCalling能力，才能有效利用MCP与外部工具交互呢？答案可能和你想象的不一样。

that's boy·2025-04-14 05:14

常见LLM大模型概览与详解

以下是一些常见的大模型的详细介绍，包括LLaMA2、LLaMA3、BLOOM、BERT、Falcon180B、Mistral7B、OpenHermes、GPT-NeoX-20B、Pythia、OpenLLaMA、OlMA、GPT-4系列、Claude-3、GLM-4、文心一言、通义千问、Abad6、qwen等模型。1.LLaMA2定义和来源：LLaMA2是LLaMA（LargeLanguageMo

夏沫の梦·2025-04-14 05:41

《多Agent自动选择与链式执行方案技术白皮书》大纲

《多Agent自动选择与链式执行方案技术白皮书》大纲1.引言背景与挑战：随着大语言模型（LLM）的广泛应用，单一智能体（Agent）已难以满足复杂任务的需求。

大霸王龙·2025-04-14 05:41

LLM辅助软件测试：提高代码质量的新方法

《LLM辅助软件测试：提高代码质量的新方法》关键词：LLM（大型语言模型）软件测试自动化测试缺陷检测性能测试摘要：本文深入探讨了LLM（大型语言模型）在软件测试中的应用，阐述了LLM如何通过自然语言处理技术辅助自动化测试

AI天才研究院·2025-04-13 15:10

论文阅读：NeurIPS Workshop Weakly Supervised Detection of Hallucinations in LLM Activations

CSPhD-winston-杨帆·2025-04-13 13:00

Spring AI 结构化输出详解

一、SpringAI结构化输出的定义与核心概念SpringAI提供了一种强大的功能，允许开发者将大型语言模型（LLM）的输出从字符串转换为结构化格式，如JSON、XML或Java对象。

大树~~·2025-04-13 06:42

对话记忆（Conversational Memory）

一、引言在与大型语言模型（LLM）交互的场景中，对话记忆（ConversationalMemory）指的是模型能够在多轮对话中保留、检索并利用先前上下文信息的能力。

大树~~·2025-04-13 06:40

SGLang实战：从KV缓存复用到底层优化，解锁大模型高效推理的全栈方案

在当今快速发展的人工智能领域，大型语言模型(LLM)的应用已从简单对话扩展到需要复杂逻辑控制、多轮交互和结构化输出的高级任务。面对这一趋势，如何高效地微调并部署这些大模型成为开发者面临的核心挑战。

SYC_MORE·2025-04-13 05:06

解码ChatBI技术形态：独立对话框、插件式与IM集成模式的技术优劣

ChatBI的形态之争随着大语言模型（LLM）技术的成熟，**对话式商业智能（ChatBI）**正成为企业数据分析的新范式。

zandy1011·2025-04-13 03:21

AI爬虫：Crawl4AI的安装和详细使用案例（开源 LLM 友好型网络爬虫）

数据知道·2025-04-13 00:34

微调和蒸馏：详细技术全解_蒸馏微调

前言LLM已经彻底改变了人工智能，特别是具有数十亿到数百亿参数的模型，使其在各种自然语言处理（NLP）任务中实现了最先进的表现。然而，它们庞大的体量带来了计算效率、适应性和部署可行性方面的挑战。

慕烟疏雨·2025-04-12 22:56

AI部署架构：A100、H100、A800、H800、H20的差异以及如何选型？开发、测试、生产环境如何进行AI大模型部署架构？

本文的原始文章传送门尼恩：LLM大模型学习圣经PDF的起源在40岁老架构师尼恩的读者交流群(50+)中，经常性的指导小伙伴们改造简历。

45岁资深老架构师尼恩·2025-04-12 22:21

如何使用少量样本（Few-Shot）示例提升大语言模型性能

如何使用少量样本（Few-Shot）示例提升大语言模型性能引言在使用大语言模型（LLM）时，我们经常需要引导模型生成特定格式或风格的输出。一种简单而有效的方法是使用少量样本（Few-Shot）示例。

sjufgwgfhoia·2025-04-12 19:35

智能体平台终极对决：Dify、Coze、FastGPT深度评测，谁是开发者与企业的最优解？

背景介绍智能体技术浪潮下的平台化竞赛在生成式AI与大语言模型（LLM）技术驱动下，2023-2025年全球智能体（AIAgent）开发平台迎来爆发式增长。

敲代码的AI玩家·2025-04-12 15:41

谁才是AI王者？ DeepSeek、Grok、千问、ChatGPT、Claude大模型终极PK

随着2025年初DeepSeek在国内外火爆出圈，全球大语言模型（LLM）的竞争愈发激烈，几乎到了白热化。2月18日，马斯克推出了他的用20万张GPU训练的最新的“地表最强”的大模型Grok3。

qweqwety·2025-04-12 15:10

ChatGPT、DeepSeek 与 Grok：三大 AI 模型的优势与劣势对比

1.引言随着人工智能技术的飞速发展，大语言模型（LLM）在智能问答、代码生成、数据分析等领域的应用日益广泛。ChatGPT、DeepSeek和Grok作为当下三大主流AI模型，各具特色。

慌ZHANG·2025-04-12 14:08

AI大模型之提示词工程进阶版（二）

1.零样本提示如今，经过⼤量数据训练并调整指令的LLM能够执⾏零样本任务。prompt="""将文本分类为中性、负面或正面。文本：我认为这次假期一般。情感："""#prompt="中国的首都是哪里？"

程序员搞AI·2025-04-11 22:44

LLM Weekly（2025.02.03-02.09）

本次主要是针对2.3-2.9之间的LLM论文和相关新闻进行摘要总结。1新闻Gemini2.0现已对所有人开放。

UnknownBody·2025-04-11 20:59

【建议收藏】MCP：AI Agent开发的秘密武器，从入门到实战的全流程指南

当下AI应用开发面临一个核心痛点：如何让LLM优雅地与外部世界交互？

大模型本地部署·2025-04-11 12:36

一文秒懂 AI 核心： Agent、RAG、Function Call 与 MCP 全解析

我们用一个表格来总结下它们的关系和区别：特性MCP(模型上下文协议)RAG(检索增强生成)Agent(智能体)FunctionCall(函数调用)核心思想标准化AI与外部数据/工具的通信协议检索外部知识+增强提示+生成回答LLM

‍。。。·2025-04-11 06:00

提示词优化建议：如何高效引导AI模型输出

提示词建议：如何高效使用大语言模型在与大语言模型（LLM）交互时，精心设计的提示词（prompt）是获取高质量回答的关键。以下是一些优化提示词的建议，帮助你更好地利用模型的能力。

禾日木目心·2025-04-11 02:08

为什么PDF文件更适合LLM大模型信息提取？

为什么PDF文件更适合LLM大模型信息提取？在Dify平台中，我们通过LLM大模型提取上传文件中的指定信息。目前使用的大模型包括qwen2:7b和deepseek-r1:70b。

禾日木目心·2025-04-11 02:35

用户画像（https://github.com/memodb-io/memobase）应用

/api/config.yaml这里我的配置内容如下config.yaml(因为我是调用的符合openai格式的大模型，所以我没改，如果要是别的大模型的话，需要自己再做兼容)llm_api_key:sk-llm_base_ur

fc&&fl·2025-04-10 20:27

推荐频道

llm