LLM 第9页

探索 Dify：开源 LLM 应用开发平台

探索Dify：开源LLM应用开发平台介绍在快速发展的AI和机器学习领域，开发人员不断寻求高效的工具，以无缝地从原型过渡到生产。Dify正是在这样的背景下应运而生的。

weixin_40941102·2025-02-12 15:38

从语言模型获取结构化数据输出的高级技巧

标题:从语言模型获取结构化数据输出的高级技巧内容:从语言模型获取结构化数据输出的高级技巧引言在使用大型语言模型(LLM)时,我们经常需要模型返回特定格式的结构化数据,而不仅仅是自由格式的文本。

stjklkjhgffxw·2025-02-12 14:29

TAG，一种用于复杂问题解答的统一模型

TAG，一种用于复杂问题解答的统一模型阅读时长：19分钟发布时间：2025-02-12近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎

·2025-02-12 13:13

Langchain Agents

LangchainAgents文档位置：https://js.langchain.com/docs/modules/agents/Agents某些应用程序需要根据用户输入对LLM和其他工具进行灵活的调用链

sin(38.1727063)·2025-02-12 13:25

【Python】科研代码学习：十七模型参数合并，safetensors / bin

知识点：save_pretrained还会新增的文件知识点：在保存模型参数时，大小发生了成倍的变化前言众所周知，LLM的模型参数一般保存在.safetensors或者.bin结尾的大文件但是通过一个RLHF

溢流眼泪·2025-02-12 10:08

让 LLM 来评判 | 选择 LLM 评估模型

基础概念这是让LLM来评判系列文章的第一篇，敬请关注系列文章:基础概念选择LLM评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示什么是评估模型？

·2025-02-12 09:39

开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡（十五）

二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(LLM)。

开源技术探险家·2025-02-12 04:50

让 LLM 来评判 | 基础概念

基础概念这是让LLM来评判系列文章的第一篇，敬请关注系列文章:基础概念选择LLM评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示什么是评估模型？

·2025-02-12 01:31

自动评估基准 | 一些评估测试集

需要注意的是：大部分数据集有些“过时”，因为它们是在LLM出现之前构建的，当时是为了评估语言文本的某个特定属性(如翻译、摘要)，但是可能已经不适合现在的LLM评估方法了(现在的

·2025-02-12 01:00

通用辅助生成: 使用任意辅助模型加速解码

太长不看版:许多LLM(如gemma-2-9b、Mixtral-8x22B-Instruct-v0.1等)苦于缺乏对应小模型，而无法适用辅助生成方案。

·2025-02-12 01:25

让 LLM 来评判 | 评估你的评估结果

评估你的评估结果这是让LLM来评判系列文章的第三篇，敬请关注系列文章:基础概念选择LLM评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示在生产中或大规模使用LLM评估模型之前

·2025-02-12 00:20

大语言模型多代理协作（MACNET）

研究发现了小世界协作现象和协作缩放定律，为LLM系统资源预测和优化提供了思路。研究背景与动机：大语言模型（LLMs）因神经缩放定律展现出强大能力，

ZhangJiQun&MXP·2025-02-12 00:51

新手必备！深入解析：如何使用 Ollama 下载与使用本地大语言模型

在当今数字化时代，大语言模型（LLM）的应用越来越广泛，从自然语言处理到文本生成，从代码辅助到智能问答，它们都展现出了强大的能力。然而，使用云端大语言模型往往面临着成本高昂、隐私泄露等问题。

大懒猫软件·2025-02-11 16:22

LLM推理优化——PagedAttention初识篇（vLLM初识（二））

LLM推理优化——PagedAttention初识篇（vLLM初识（二））前言在LLM推理优化——KVCache篇（百倍提速）中，我们已经介绍了KVCache技术的原理，从中我们可以知道，KVCache

荼荼灰·2025-02-11 15:44

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

HuggingFaceCLI下载DeepSeek-R1-Distill-Qwen-32B模型启动启动命令启动确认模型验证发送API请求示例输出注意事项参考链接前言VLLM是一个高效且轻量的大规模语言模型（LLM

engchina·2025-02-11 14:41

动手学大语言模型LLM-02

文章目录LLMAPI开发基础知识PromptTemperaturesystemprompt使用LLMAPIpromptengineeringprompt设计原则1、编写清晰、具体指令1、使用分隔符清晰表示不同的输入部分2、寻求结构化的输出3、要求模型检查是否满足条件4、提供少量的示例2、让模型有时间去思考1、指定完成任务的步骤2、指导模型在下结论之前找到自己的解法LLMAPI开发基础知识Promp

阿苏拉则_妫·2025-02-11 12:28

如何在 VSCode 中使用通义灵码（Tongyi Lingma）智能编程助手

与GitHubCopilot类似，通义灵码基于大语言模型（LLM），可以提供代码补全、智能纠错、代码生成等功能，极大提升开发效率。本文将详细介绍如何在VSCode中安装和使用通义灵码，

全栈探索者chen·2025-02-11 06:09

【AI学习】LLM的发展方向

Scalinglaw，以前主要集中在LLM的预训练方面。一段时间有个说法，

bylander·2025-02-11 03:47

SEO友好架构提升LLM应用的可发现性

《SEO友好架构提升LLM应用的可发现性》文章关键词SEO友好架构语言模型（LLM）搜索引擎优化（SEO）可发现性内容优化技术优化用户体验优化信息组织关键词策略社交媒体推广摘要本文旨在探讨如何通过SEO

AI天才研究院·2025-02-10 17:00

【Neo4j 】学习笔记：GraphRAG 宣言：为 GenAI 添加知识

我们即将意识到，要想用GenAI做任何有意义的事情，你不能只依赖自回归LLM来做决定。我知道你在想什么：“RAG就是答案。”或者微调，或者GPT-5。是的。基于向量的RAG和微调等技术可以提供帮助。

等风来不如迎风去·2025-02-10 16:53

AI系列：大语言模型的function calling（下）- 使用LangChain

LangChainTool/Functioncalling1.Tool/function加强功能LangChain的tool装饰器其他方式:Pydantic2.绑定tools/functions3.调用大模型(LLM

liyane·2025-02-10 05:38

LLM 中的 vocabulary 和 embedding vector

vocabulary将自然语言转换为tokenid是根据模型使用的词汇表(vocabulary)进行的。这个过程通常分为两个步骤:分词(Tokenization)将输入的自然语言文本按照某种规则分割成一系列的token,可以是单词、子词或者字符等。分词的规则需要事先定义好,通常使用诸如基于词典、基于规则、基于统计等方法。查表(Lookup)将分词得到的每个token在词汇表中查找对应的数值id。词

Overman..·2025-02-10 04:33

GraphRAG如何使用ollama提供的llm model 和Embedding model服务构建本地知识库

使用GraphRAG踩坑无数在GraphRAG的使用过程中将需要踩的坑都踩了一遍（不得不吐槽下，官方代码有很多遗留问题，他们自己也承认工作重心在算法的优化而不是各种模型和框架的兼容性适配性上），经过了大量的查阅各种资料以及debug过程（Indexing的过程有点费机器），最终成功运行了GraphRAG项目。先后测试了两种方式，都成功了:使用ollama提供本地llmmodel和Embedding

m0_74824865·2025-02-10 03:58

TC-LLaVA论文笔记

RoPE介绍理解LLM位置编码:RoPE|LinsightMotivation在基于视频的multimodallargelanguagemodel中，更好地利用视频提供的时序信息。

0yumiwawa0·2025-02-10 03:27

大模型学习笔记 - LLM 对齐优化算法 DPO

LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预训练是从大量语料中进行无监督学习，语料库内容混杂，训练的目标是语言模型损失，任务是nexttokenprediction

JL_Jessie·2025-02-10 03:54

AI学习专题（一）LLM技术路线

阶段1：AI及大模型基础（1-2个月）数学基础线性代数（矩阵、特征值分解、SVD）概率论与统计（贝叶斯定理、极大似然估计）最优化方法（梯度下降、拉格朗日乘子法）编程&框架Python（NumPy、Pandas、Matplotlib）PyTorch&TensorFlow基础HuggingFaceTransformers入门深度学习基础机器学习基础（监督/无监督学习、正则化、过拟合）反向传播、优化器（

王钧石的技术博客·2025-02-10 01:39

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域，大型语言模型（LLMs）的应用越来越广泛。

qq_37836323·2025-02-10 01:37

机器学习回归评估指标全解析：如何衡量模型的准确性？回归评估指标-MSE、MAE、RMSE、R²分数

阅读时长：25分钟发布时间：2025-02-09近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文

·2025-02-09 22:18

为什么要学习AI/机器学习

考虑到当前技术发展趋势和未来潜力，我建议重点学习AI/机器学习相关技术，特别是大语言模型(LLM)相关的技术栈。原因如下：1.为什么选择AI/LLM？

数字沉思·2025-02-09 21:09

重拾二进制之魂：大语言模型与逆向工程的奇幻旅程

逆向工程，这门解构编译产物、还原软件真貌的神秘艺术，正迎来了一场革命性的变革——由大语言模型赋能的LLM4Decompile系统。

步子哥·2025-02-09 18:50

微软 LayoutLM：文档理解的强大工具

深入了解LayoutLM：文档理解的强大工具阅读时长：15分钟发布时间：2025-02-09近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM

·2025-02-09 18:35

探秘检索增强生成：上下文检索、混合搜索与密集检索全解析

探秘检索增强生成：上下文检索、混合搜索与密集检索全解析阅读时长：15分钟发布时间：2025-02-09近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎

·2025-02-09 18:33

从零开始构建一个大语言模型-第六章第一节

6.8将大语言模型用作垃圾邮件分类器本章内容涵盖介绍不同的大语言模型微调方法为文本分类准备数据集修改预训练大语言模型以进行微调使用微调后的大语言模型对新数据进行分类到目前为止，我们已经编写了大语言模型（LLM

释迦呼呼·2025-02-09 18:17

大模型 RAG 知识总结

在LLM已经具备了较强能力的基础上，仍然存在以下问题：幻觉问题：LLM文本生成的底层原理是基于概率的tokenbytoken的形式，因此会不可避免地产生“一本正经的胡说八道”的情况；时效性问题：LLM的规模越大

da pai ge·2025-02-09 16:38

llama.cpp的C语言API使用

它的源代码直接在github上下载即可：GitHub-ggerganov/llama.cpp:LLM

怎么这么多名字都被占了·2025-02-09 13:43

服务网格（Service Mesh）在LLM应用架构中的应用

文章关键词服务网格、LLM应用架构、微服务通信、控制平面、数据平面、性能优化、安全性摘要本文深入探讨了服务网格在大型语言模型（LLM）应用架构中的关键作用。

AI天才研究院·2025-02-09 11:32

走进LLM世界之LLM历史与发展

1.LLM的起源1.1NLP的早期研究自然语言处理（NLP）的历史可以追溯到20世纪50年代，当时科学家们开始尝试让计算机理解和生成人类语言。

我就是全世界·2025-02-09 11:26

DeepSeek-V3 Technical Report

本文是LLM系列文章，针对《DeepSeek-V3TechnicalReport》的翻译。

UnknownBody·2025-02-09 08:35

14.4K+ Star！GPT Researcher：一个基于AI的智能研究助手

GPTResearcher简介GPTResearcher[1]是一个基于大型语言模型（LLM）的自动化智能体，目标是对任何给定主题进行在线全面研究。

鱼满满记·2025-02-09 07:00

Langchain运行报错踩坑记录

fromlangchain_openaiimportChatOpenAIimportos#加载.env到环境变量fromdotenvimportload_dotenv,find_dotenv_=load_dotenv(find_dotenv())llm

pumpkin84514·2025-02-09 04:36

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

DeepSeek（DeepSeek-V3深度剖析：下一代AI模型的全面解读）最近在AI社区引起了不小的轰动，这要归功于它以相对较低的成本提供令人印象深刻的性能。这是深入了解大型语言模型LLMs如何训练的绝佳机会。本文将深入探讨LLMs的训练过程，特别是强化学习（ReinforcementLearning，RL）（深度解析DeepSeekR1：强化学习与知识蒸馏的协同力量）在这一领域的应用，从TRP

大模型之路·2025-02-08 20:03

【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

一、引言与背景在人工智能领域，大型语言模型（LLM）如DeepSeek以其卓越的自然语言理解和生成能力，推动了众多应用场景的发展。

后端研发Marion·2025-02-08 14:24

大语言模型应用指南：Gemini简介

1.背景介绍1.1大型语言模型的兴起近年来，随着计算能力的提升和数据量的爆炸式增长，大型语言模型（LLM）逐渐成为人工智能领域的研究热点。

AI天才研究院·2025-02-08 11:03

大语言模型多token预测技术

近年来，大语言模型（LLM）在自然语言处理领域取得了突破性进展，凭借其强大的语言理解和生成能力，在各种NLP任务中展现出惊人的性能。

deepdata_cn·2025-02-08 09:21

【RAG知识库】本地搭建chatgpt知识库

实现原理如下图所示，过程包括加载文件->读取文本->文本分割->文本向量化->问句向量化->在文本向量中匹配出与问句向量最相似的topk个->匹配出的文本作为上下文和问题一起添加到prompt中->提交给LLM

LLM教程·2025-02-08 06:23

【Ollama+Deepseek】本地化部署运行Deepseek模型

它专注于简化LLM的本地运行流程，无需复杂的配置即可在个人设备（如

·2025-02-08 06:32

DeepSeek-R1深度报告：基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享

DeepSeek-R1深度报告——50道相关面试题——深刻理解相关概念（DeepSeek-R1大模型+强化学习（RL）+推理能力）一、前言与背景铺垫在当今人工智能与大语言模型（LargeLanguageModel,LLM

快撑死的鱼·2025-02-08 05:19

【Ollama+Deepseek】本地化部署运行Deepseek模型

它专注于简化LLM的本地运行流程，无需复杂的配置即可在个人设备（如

·2025-02-08 02:59

Chapter4.1 Coding an LLM architecture

4ImplementingaGPTmodelfromScratchToGenerateText4.1CodinganLLMarchitecture4ImplementingaGPTmodelfromScratchToGenerateText本章节包含编写一个类似于GPT的大型语言模型（LLM

亲持红叶·2025-02-08 01:53

大模型(LLM)微调并不复杂，数据才是关键：3个实例详解数据准备

今天咱们聊聊一个听起来很高大上的词——微调（Fine-Tuning）。听说过吗？别担心，今天我们不打算深挖那些复杂的技术细节，而是要告诉你们一个简单的事实：微调其实一点都不复杂，真正的关键在于——数据！前排提示，文末有大模型AGI-CSDN独家资料包哦！在这篇文章里，我们不仅会深入浅出地介绍什么是微调，还会通过三个具体的实例，教你们如何准备高质量的数据集，让你们的模型表现出色。准备好了吗？让我们一

程序员二飞·2025-02-08 01:21

推荐频道

LLM

探索 Dify：开源 LLM 应用开发平台

从语言模型获取结构化数据输出的高级技巧

TAG，一种用于复杂问题解答的统一模型

Langchain Agents

【Python】科研代码学习：十七 模型参数合并，safetensors / bin

让 LLM 来评判 | 选择 LLM 评估模型

开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡（十五）

让 LLM 来评判 | 基础概念

自动评估基准 | 一些评估测试集

通用辅助生成: 使用任意辅助模型加速解码

让 LLM 来评判 | 评估你的评估结果

大语言模型多代理协作（MACNET）

新手必备！深入解析：如何使用 Ollama 下载与使用本地大语言模型

LLM推理优化——PagedAttention初识篇（vLLM初识（二））

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

动手学大语言模型LLM-02

如何在 VSCode 中使用通义灵码（Tongyi Lingma）智能编程助手

【AI学习】LLM的发展方向

SEO友好架构提升LLM应用的可发现性

【Neo4j 】学习笔记：GraphRAG 宣言：为 GenAI 添加知识

AI系列：大语言模型的function calling（下）- 使用LangChain

LLM 中的 vocabulary 和 embedding vector

GraphRAG如何使用ollama提供的llm model 和Embedding model服务构建本地知识库

TC-LLaVA论文笔记

大模型学习笔记 - LLM 对齐优化算法 DPO

AI学习专题（一）LLM技术路线

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

机器学习回归评估指标全解析：如何衡量模型的准确性？回归评估指标-MSE、MAE、RMSE、R²分数

为什么要学习AI/机器学习

重拾二进制之魂：大语言模型与逆向工程的奇幻旅程

微软 LayoutLM：文档理解的强大工具

探秘检索增强生成：上下文检索、混合搜索与密集检索全解析

从零开始构建一个大语言模型-第六章第一节

大模型 RAG 知识总结

llama.cpp的C语言API使用

服务网格（Service Mesh）在LLM应用架构中的应用

走进LLM世界之LLM历史与发展

DeepSeek-V3 Technical Report

14.4K+ Star！GPT Researcher：一个基于AI的智能研究助手

Langchain运行报错踩坑记录

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

大语言模型应用指南：Gemini简介

大语言模型多token预测技术

【RAG知识库】本地搭建chatgpt知识库

【Ollama+Deepseek】本地化部署运行Deepseek模型

DeepSeek-R1深度报告：基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享

【Ollama+Deepseek】本地化部署运行Deepseek模型

Chapter4.1 Coding an LLM architecture

大模型(LLM)微调并不复杂，数据才是关键：3个实例详解数据准备

【Python】科研代码学习：十七模型参数合并，safetensors / bin