LLm

【解决方案】RAG实践：ES混合搜索BM25+kNN(cosine)

1缘起最近在研究与应用混合搜索，存储介质为ES，ES作为大佬牌数据库，非常友好地支持关键词检索和向量检索，当然，支持混合检索（关键词检索+向量检索），是提升LLM响应质量RAG(Retrieval-augmentedGeneration

天然玩家·2025-03-31 03:21

RAG 技术探秘：原理、架构与多领域应用实践全解析

一、引言1.1研究背景与动机随着自然语言处理（NLP）技术的飞速发展，大语言模型（LLM）在众多任务中展现出了强大的能力，如文本生成、问答系统和机器翻译等。

hy098543·2025-03-30 22:47

2025最新“科研创新与智能化转型“暨AI智能体开发与大语言模型的本地化部署、优化技术实践

智能体的类型和应用场景、典型的智能体应用，如：GoogleDataScienceAgent等）2、智能体（Agent）与大语言模型（LLM）的关系3、智能体（Agent）的五种能力（记忆、规划、工具、自主决策

weixin_贾·2025-03-30 21:45

LLM中的分块技术：原理、应用与展望

在大语言模型（LLM）飞速发展的当下，分块技术（Chunking）（RAG中的分块策略：从基础到前沿的全面剖析）作为提升模型性能的关键手段，受到了广泛关注。

大模型之路·2025-03-30 21:11

解锁 AI 生产力：Prompt-Optimizer—— 你的提示词神器

解锁AI生产力：Prompt-Optimizer——你的提示词神器在与大语言模型（LLM）打交道的过程中，相信不少朋友都遇到过这些让人头疼的问题：满心期待地输入一个自认为清晰明了的问题，得到的却是一堆如同

东锋17·2025-03-30 20:36

太不容易了！！！在4台服务器成功部署了满血版 DeepSeek-R1-671B 大模型

满血版DeepSeek-R1-671B内容展示Ray集群状态ProductionMetrics(self-llm)deepseek@deepseek2:~$curlhttp://10.119.85.138

大模型与计算机视觉·2025-03-30 08:09

10篇R1相关的研究全面汇总，万字思考！

原创长琴DatawhaleDatawhale干货作者：长琴，Datawhale成员本文通过10篇R1相关的研究，介绍R1后LLM的新范式。其核心就是如何进一步增强LLM的能力。

·2025-03-30 08:19

大模型Agent发展的五重境界、Agent四要素

一、Agent发展的五重境界第一阶段：工具型agent框架(Tool-basedAgentFrameworks)工具型agent框架是在ChatGPT横空出世后同时期出现的，当时LLM刚刚展现出强大的文本生成能力

大模型面试·2025-03-30 08:05

如何用 Ollama 和 DeepSeek 打造本地 AI 助手

✅一：为什么要本地部署大语言模型在人工智能快速发展的今天，大语言模型（LLM）如ChatGPT和DeepSeek已经变得越来越流行。

我很爱编程·2025-03-29 23:41

手把手教你用PyTorch从零训练自己的大模型（非常详细）零基础入门到精通，收藏这一篇就够了

长按关注《AI科技论谈》LLM是如今大多数AI聊天机器人的核心基础，例如ChatGPT、Gemini、MetaAI、MistralAI等。这些LLM背后的核心是Transformer架构。

heaven522·2025-03-29 23:41

【人工智能】从 Llama 到 DeepSeek：开源大模型的演进与技术对比

解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界随着人工智能的迅猛发展，开源大语言模型（LLM）在自然语言处理领域扮演着越来越重要的角色。

蒙娜丽宁·2025-03-29 19:19

在MacBook Air上本地部署大模型deepseek指南

如果你也想体验大模型的魅力，那么这篇文章将指导你如何在你的MacBookAir上本地部署大模型.工具准备为了实现本地部署，你需要以下工具：Ollama：一个开源的本地大语言模型（LLM）运行框架，支持在本地计算机上部署各种开源大语言模型

沙滩捡贝壳的小男孩·2025-03-29 15:54

AI大模型学习文档+教程+PDF书籍+系统学习路线，一套全拿到！

如何系统的去学习大模型LLM？大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。“AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

大模型部署·2025-03-29 15:52

本地知识库部署指南：FastGPT 与 Dify，轻松上手！

本文主要内容本地部署Dify、FastGPT、OllamaDify、FastGPT对接一些目前免费的LLM大语言AI模型Dify、FastGPT对接Ollama本地模型大家好，我是一名喜欢在家折腾本地部署的开发者

大模型应用·2025-03-29 14:45

Stable Diffusion 1 - 初识跑通文字生成图片

LLM、AIGC、RAG开发交流裙：377891973文章目录关于StableDiffusionLexica代码实现安装依赖库登陆huggingface查看huggingfacetoken下载模型计算生成设置宽高测试迭代次数生成多列图片关于

知识搬运bot·2025-03-29 12:33

Muse: 使用掩码生成变换器的文本到图像生成

Muse通过预训练大型语言模型（LLM）的掩

王良一呀·2025-03-29 10:47

AI Agent开发大全第十四课-零售智能导购智能体的RAG开发理论部分

开篇经过前面的一些课程，我们手上已经积累了各种LLM的API调用、向量库的建立和使用、embedding算法的意义和基本使用。这已经为我们具备了开发一个基本的问答类RAG的开发必需要素了。

TGITCIC·2025-03-29 10:15

大语言模型在生成文章摘要、新闻标题领域的应用

大语言模型（LLM）在文章摘要和新闻标题生成领域已形成多个成熟应用，这些应用通过提升效率、优化质量和适应复杂场景，显著改变了内容处理的方式。

knightissocool·2025-03-29 03:21

LLM在文章摘要和新闻标题生成领域的应用案例

以下是大语言模型（LLM）在文章摘要和新闻标题生成领域的几个成熟应用案例，结合具体数据和实践背景进行分析：一、亚马逊文本摘要系统应用场景：整合于Kindle电子书阅读器和AWS云服务中，支持多类型文本的自动化摘要生成

knightissocool·2025-03-29 03:21

LLM在文章摘要生成领域应用的模型和能力

以下是大语言模型在文章摘要和新闻标题生成领域成熟应用中所利用的主要模型及其核心能力分析，结合具体案例与技术特性：一、主流大模型及其能力OpenAI的GPT系列（如GPT-3、GPT-4）核心能力：动态生成与优化：通过调整提示词（如“生动但中性”），生成多样化的标题变体或摘要风格，适应不同场景需求。引文敏感处理：结合多步提示工程（如先提取引文再生成摘要），显著提升引文保留准确率（如德国媒体IPPEN

knightissocool·2025-03-29 03:21

LLM模型入门

前言好久没动过博客了，最近正好在看ai安全，就以此着手讲讲现在最流行的LLM模型吧LLM是什么线下最火的deepseek，chatGPT，通义千问等所有大模型都有个统称，叫做LLM（LargeLanguageModel

長安一片月·2025-03-28 23:53

爆火 | API终将淘汰，MCP+Milvus+LLM才是Agent开发新范式

前言“大模型很聪明，但又貌似什么问题都解决不了。”这应该是不少用户使用大模型过程中都会面临的问题。比如，问deepseek，即将到来的清明节有什么习俗，AI可以引经据典的给出答案；但如果要它给出一份三天两晚的清明旅行规划，给出的答案，就好像总是差点意思。原因很简单，在做旅行规划的时候，大模型缺乏必要的天气、机票、铁路、导航、酒店等必要数据与工具的接入。就像一个顶级聪明的大脑，但没有配备外部的“数据

ai大模型应用开发·2025-03-28 14:49

Ai工作流工具有那些如Dify、coze扣子等以及他们是否开源

Dify（https://difycloud.com/）核心定位：专业级LLM应用开发平台，支持复杂AI工作流构建与企业级管理。典型场景：企业智能客服、数据分析系统、复杂自动化流程构建等。

橙-极纪元JJYCheng·2025-03-28 13:41

【ESP32】【LLM API】Accessing the Xunfei Spark LLM API with ESP32

AccessingtheXunfeiSparkLLMAPIwithESP32Real-timeconversationwithXunfeiSparklargelanguagemodelviaESP32microcontrollerIntroductionWiththerapiddevelopmentofartificialintelligencetechnology,largelanguagemo

hmywillstronger·2025-03-28 06:21

构建你的Agent工厂#OpenAI Agents SDK

主要功能包括代理（配备工具和指令的LLM）、交接（代理间任务委托）和防护栏

shadowcz007·2025-03-28 06:20

AI大模型全攻略：原理 · 部署 · Prompt · 场景应用

AI大模型（LargeLanguageModels,LLM）通常指参数规模在数十亿甚至千亿级别的深度神经网络模型，如GPT、Claude、BERT、LLaMA、Baichua

滴答滴答滴嗒滴·2025-03-28 04:05

基于LLM的Agent框架全面比较分析：MGX（MetaGPT X）、AutoGen、OpenHands与秒哒（MiaoDa）

摘要本文对当前四种领先的基于LLM的Agent框架——MGX（MetaGPTX）、AutoGen、OpenHands和秒哒（MiaoDa）进行了全面比较分析。

由数入道·2025-03-28 03:31

数模分离革命：LLM驱动下的零代码开发新范式

通过大型语言模型（LLM）提炼功能、UI、数据元等核心模型，结合零代码平台的动态配置能力，开发者可将需求直接映射为可执行的应用，实现“模型即代码”的跨越式升级。

领码科技·2025-03-28 02:25

使用您自己的 LLM API 密钥运行多代理工作流程。OpenAI Operator 的替代品。

OpenAIOperator的免费替代品，具有灵活的LLM选项和多代理系统。

struggle2025·2025-03-27 21:22

利用Ollama部署Llama 3/deepseek-r1模型，只需5行代码即可实现对话

文章目录1.前言2.通过Ollama在本地运行Llama3和deepseek-r13.通过ollama的pythonapi与大模型对话4.部分LLM参数4.1Temperature调节推理能力和创造力4.2TestingSeed

Lins号丹·2025-03-27 20:41

Alluxio 携手 vLLM Production Stack 加速大语言模型推理

作为大语言模型（LLM）推理领域的开源项目，vLLMProductionStack旨在为LLM推理提供高效的集群级全栈解决方案。

·2025-03-27 19:53

大模型工程化：面向生产环境的LLM系统架构设计

一、高性能推理引擎设计1.1层次化计算优化1.2编译时优化示例#使用MLIR实现计算图优化withmlir.Context()asctx:module=Module.parse("""func.func@main(%input:tensor)->tensor{%cst=arith.constantdense:tensor%0=linalg.matmulins(%input,%cst:tensor,

桂月二二·2025-03-27 16:15

LLM实践（二）——基于llama-factory的模型微调

目录SFT的lora微调1、环境部署2、准备数据与配置3、创建微调配置文件：yaml配置文件4、Lora微调：基于lora微调的yaml配置文件启动lora微调5、启动模型：基于llama-factory自带的功能6、模型调用、推理：使用curl命令SFT的lora微调1、环境部署还是要安装一个单独的conda环境（python=3.10），激活环境；下载llama-factory的GitHub项

lucky_chaichai·2025-03-27 09:44

《AI大模型开发笔记》企业RAG技术实战（二）

llamaindex实例https://docs.llamaindex.ai/en/stable/api_reference/环境配置我们继续使用前面langchain例子的python虚环境，不用新建，激活就行不同LLM

Richard Chijq·2025-03-27 08:06

Unsloth 库和Hugging Face Transformers 库对比使用

Unsloth库：Unsloth是一个专注于加速大语言模型（LLM）微调的开源工具。它通过优化计算步骤和GPU内核，显著提升训练速度并减少内存使用。

背太阳的牧羊人·2025-03-26 21:17

深入学习LLM开发第六章：LangChain如何从大模型调用工具

Toolcalling模块允许一个大模型通过“调用工具”来响应请求。虽然“工具调用”这个名字意味着模型正在直接执行某些操作，但事实并非如此！该模型只生成工具的参数，实际运行（或不运行）取决于用户。工具调用是一种从模型生成结构化输出的通用技术，即使您不打算调用任何工具，也可以使用它。一个示例用例是从非结构化文本中提取。核心概念工具（Tools）:预定义的可调用函数（如查询天气、执行计算等）。工具描述

desert_fish1976·2025-03-26 20:13

那些自学【AI大模型】的，能骂醒一个算一个！

想要完全了解大模型，你首先要了解市面上的LLM大模型现状，学习Python语言、Prompt提示工程，然后深入理解FunctionCalling、RAG、LangChain、Agents等很多人不知道想要自学大模型

大模型入门学习·2025-03-26 18:27

手把手带你在Windows中搭建本地知识库（基于ollama本地部署大模型+客户端安装版AnythingLLM）非docker环境部署

一、Ollama安装Ollama是一个专注于本地运行大型语言模型（LLM）的框架，它使得用户能够在自己的计算机上轻松地部署和使用大型语言模型，而无需依赖昂贵的GPU资源。

慕慕涵雪月光白·2025-03-26 18:24

Linux安装AnythingLLM

它能够将任何文档、资源或内容片段转化为大语言模型（LLM）在聊天中可以利用的相关上下文。AnythingLLM支持多种文档类型（PDF、TXT、DOCX等），具有对话和查询两种聊天模式。

neter.asia·2025-03-26 18:52

LangChain4j 性能优化与监控：构建高效的 AI 应用（详细版）

LangChain4j性能优化与监控：构建高效的AI应用（详细版）在前几篇博客中，我们已介绍了LangChain4j与LLM代理、知识库、向量数据库、多模态AI以及SpringBoot集成的关键技术。

小张学Ai·2025-03-26 17:14

走进吴恩达：揭秘Prompt Engineering 提示词工程

PromptEngineering概览何为Prompt在自然语言处理领域，尤其是与大型语言模型（LLM）互动时，Prompt起着至关重要的作用。

AI大模型教程·2025-03-26 14:55

Oracle AI应用的LLM模型典型配置

最近在做一些基于Oracle的一些AI应用测试工作，AI肯定离不开配置LLM相关，虽然是简单配置类，但实际还是遇到一些卡点，记录下来供今后参考。

·2025-03-26 12:25

本地部署Dify 添加Ollama模型DeepSeek

在Ollama插件冲添加LLM模型，名称：deepseek-r1:14b基础URL：http://host.docker.i

tinghe17·2025-03-26 10:25

【大模型知识点】检索增强生成（Retrieval Augmented Generation，RAG）简要介绍

Retrieval-Augmented-Generation：检索-增强-生成一句话总结：通过引入外部数据库或知识库中的信息来增强LLM生成内容2.RAG的应用问答系统：RAG从外部知识库中检索相关信息

自信的小螺丝钉·2025-03-26 10:24

ChatGPT、DeepSeek、Grok：AI 语言模型的技术演进与未来趋势

1.引言人工智能（AI）技术的快速发展，使得大语言模型（LLM）成为众多行业的重要工具。ChatGPT、DeepSeek和Grok作为当今主流的AI语言模型，各自承载着不同的技术愿景和应用方向。

慌ZHANG·2025-03-26 09:52

解读目前AI就业岗位——大语言模型（LLM）应用工程师学习路线、就业前景及岗位全解析

文章目录前言什么是大语言模型（LLM）应用工程师？岗位职责就业前景如何？

AI敲代码的手套·2025-03-26 04:38

深入理解Aider sends a repo map

RepoMap是它提供给LLM的上下文机制，用于提升模型对代码库的理解能力。以下是对这段内容的理解和使用方式的详细

超级小龙虾·2025-03-26 04:37

国产670亿参数的DeepSeek：超越Llama2，全面开源

模型概述DeepSeek，一款国产大型语言模型（LLM），凭借其670亿参数的规模，正引领着人工智能领域的新浪潮。

努力犯错·2025-03-26 02:51

NLP高频面试题（十三）——什么是大模型幻觉，如何解决大模型幻觉

深入理解大模型幻觉及其解决方案所谓大模型幻觉，是指LLM在生成文本时出现看似流畅合理但实际上却偏离事实甚至无中生有的内容。

Chaos_Wang_·2025-03-25 17:47

《深入浅出LLM基础篇》（四）：主流大模型介绍

GoAI·2025-03-25 17:14

推荐频道

LLm

【解决方案】RAG实践：ES混合搜索BM25+kNN(cosine)

RAG 技术探秘：原理、架构与多领域应用实践全解析

2025最新“科研创新与智能化转型“暨AI智能体开发与大语言模型的本地化部署、优化技术实践

LLM中的分块技术：原理、应用与展望

解锁 AI 生产力：Prompt-Optimizer—— 你的提示词神器

太不容易了！！！在4台服务器成功部署了满血版 DeepSeek-R1-671B 大模型

10篇R1相关的研究全面汇总，万字思考！

大模型Agent发展的五重境界、Agent四要素

如何用 Ollama 和 DeepSeek 打造本地 AI 助手

手把手教你用PyTorch从零训练自己的大模型（非常详细）零基础入门到精通，收藏这一篇就够了

【人工智能】从 Llama 到 DeepSeek：开源大模型的演进与技术对比

在MacBook Air上本地部署大模型deepseek指南

AI大模型学习文档+教程+PDF书籍+系统学习路线，一套全拿到！

本地知识库部署指南：FastGPT 与 Dify，轻松上手！

Stable Diffusion 1 - 初识跑通 文字生成图片

Muse: 使用掩码生成变换器的文本到图像生成

AI Agent开发大全第十四课-零售智能导购智能体的RAG开发理论部分

大语言模型在生成文章摘要、新闻标题领域的应用

LLM在文章摘要和新闻标题生成领域的应用案例

LLM在文章摘要生成领域应用的模型和能力

LLM模型入门

爆火 | API终将淘汰，MCP+Milvus+LLM才是Agent开发新范式

Ai工作流工具有那些如Dify、coze扣子等以及他们是否开源

【ESP32】【LLM API】Accessing the Xunfei Spark LLM API with ESP32

构建你的Agent工厂#OpenAI Agents SDK

AI大模型全攻略：原理 · 部署 · Prompt · 场景应用

基于LLM的Agent框架全面比较分析：MGX（MetaGPT X）、AutoGen、OpenHands与秒哒（MiaoDa）

数模分离革命：LLM驱动下的零代码开发新范式

使用您自己的 LLM API 密钥运行多代理工作流程。OpenAI Operator 的替代品。

利用Ollama部署Llama 3/deepseek-r1模型，只需5行代码即可实现对话

Alluxio 携手 vLLM Production Stack 加速大语言模型推理

大模型工程化：面向生产环境的LLM系统架构设计

LLM实践（二）——基于llama-factory的模型微调

《AI大模型开发笔记》企业RAG技术实战（二）

Unsloth 库和Hugging Face Transformers 库对比使用

深入学习LLM开发 第六章：LangChain如何从大模型调用工具

那些自学【AI大模型】的，能骂醒一个算一个！

手把手带你在Windows中搭建本地知识库（基于ollama本地部署大模型+客户端安装版AnythingLLM）非docker环境部署

Linux安装AnythingLLM

LangChain4j 性能优化与监控：构建高效的 AI 应用（详细版）

走进吴恩达：揭秘Prompt Engineering 提示词工程

Oracle AI应用的LLM模型典型配置

本地部署Dify 添加Ollama模型DeepSeek

【大模型知识点】检索增强生成（Retrieval Augmented Generation，RAG）简要介绍

ChatGPT、DeepSeek、Grok：AI 语言模型的技术演进与未来趋势

解读目前AI就业岗位——大语言模型（LLM）应用工程师学习路线、就业前景及岗位全解析

深入理解Aider sends a repo map

国产670亿参数的DeepSeek：超越Llama2，全面开源

NLP高频面试题（十三）——什么是大模型幻觉，如何解决大模型幻觉

《深入浅出LLM基础篇》（四）：主流大模型介绍

Stable Diffusion 1 - 初识跑通文字生成图片

深入学习LLM开发第六章：LangChain如何从大模型调用工具