闻达LLM 第6页

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

HuggingFaceCLI下载DeepSeek-R1-Distill-Qwen-32B模型启动启动命令启动确认模型验证发送API请求示例输出注意事项参考链接前言VLLM是一个高效且轻量的大规模语言模型（LLM

engchina·2025-02-11 14:41

动手学大语言模型LLM-02

文章目录LLMAPI开发基础知识PromptTemperaturesystemprompt使用LLMAPIpromptengineeringprompt设计原则1、编写清晰、具体指令1、使用分隔符清晰表示不同的输入部分2、寻求结构化的输出3、要求模型检查是否满足条件4、提供少量的示例2、让模型有时间去思考1、指定完成任务的步骤2、指导模型在下结论之前找到自己的解法LLMAPI开发基础知识Promp

阿苏拉则_妫·2025-02-11 12:28

如何在 VSCode 中使用通义灵码（Tongyi Lingma）智能编程助手

与GitHubCopilot类似，通义灵码基于大语言模型（LLM），可以提供代码补全、智能纠错、代码生成等功能，极大提升开发效率。本文将详细介绍如何在VSCode中安装和使用通义灵码，

全栈探索者chen·2025-02-11 06:09

【AI学习】LLM的发展方向

Scalinglaw，以前主要集中在LLM的预训练方面。一段时间有个说法，

bylander·2025-02-11 03:47

SEO友好架构提升LLM应用的可发现性

《SEO友好架构提升LLM应用的可发现性》文章关键词SEO友好架构语言模型（LLM）搜索引擎优化（SEO）可发现性内容优化技术优化用户体验优化信息组织关键词策略社交媒体推广摘要本文旨在探讨如何通过SEO

AI天才研究院·2025-02-10 17:00

【Neo4j 】学习笔记：GraphRAG 宣言：为 GenAI 添加知识

我们即将意识到，要想用GenAI做任何有意义的事情，你不能只依赖自回归LLM来做决定。我知道你在想什么：“RAG就是答案。”或者微调，或者GPT-5。是的。基于向量的RAG和微调等技术可以提供帮助。

等风来不如迎风去·2025-02-10 16:53

AI系列：大语言模型的function calling（下）- 使用LangChain

LangChainTool/Functioncalling1.Tool/function加强功能LangChain的tool装饰器其他方式:Pydantic2.绑定tools/functions3.调用大模型(LLM

liyane·2025-02-10 05:38

LLM 中的 vocabulary 和 embedding vector

vocabulary将自然语言转换为tokenid是根据模型使用的词汇表(vocabulary)进行的。这个过程通常分为两个步骤:分词(Tokenization)将输入的自然语言文本按照某种规则分割成一系列的token,可以是单词、子词或者字符等。分词的规则需要事先定义好,通常使用诸如基于词典、基于规则、基于统计等方法。查表(Lookup)将分词得到的每个token在词汇表中查找对应的数值id。词

Overman..·2025-02-10 04:33

GraphRAG如何使用ollama提供的llm model 和Embedding model服务构建本地知识库

使用GraphRAG踩坑无数在GraphRAG的使用过程中将需要踩的坑都踩了一遍（不得不吐槽下，官方代码有很多遗留问题，他们自己也承认工作重心在算法的优化而不是各种模型和框架的兼容性适配性上），经过了大量的查阅各种资料以及debug过程（Indexing的过程有点费机器），最终成功运行了GraphRAG项目。先后测试了两种方式，都成功了:使用ollama提供本地llmmodel和Embedding

m0_74824865·2025-02-10 03:58

TC-LLaVA论文笔记

RoPE介绍理解LLM位置编码:RoPE|LinsightMotivation在基于视频的multimodallargelanguagemodel中，更好地利用视频提供的时序信息。

0yumiwawa0·2025-02-10 03:27

大模型学习笔记 - LLM 对齐优化算法 DPO

LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预训练是从大量语料中进行无监督学习，语料库内容混杂，训练的目标是语言模型损失，任务是nexttokenprediction

JL_Jessie·2025-02-10 03:54

AI学习专题（一）LLM技术路线

阶段1：AI及大模型基础（1-2个月）数学基础线性代数（矩阵、特征值分解、SVD）概率论与统计（贝叶斯定理、极大似然估计）最优化方法（梯度下降、拉格朗日乘子法）编程&框架Python（NumPy、Pandas、Matplotlib）PyTorch&TensorFlow基础HuggingFaceTransformers入门深度学习基础机器学习基础（监督/无监督学习、正则化、过拟合）反向传播、优化器（

王钧石的技术博客·2025-02-10 01:39

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域，大型语言模型（LLMs）的应用越来越广泛。

qq_37836323·2025-02-10 01:37

机器学习回归评估指标全解析：如何衡量模型的准确性？回归评估指标-MSE、MAE、RMSE、R²分数

阅读时长：25分钟发布时间：2025-02-09近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文

·2025-02-09 22:18

为什么要学习AI/机器学习

考虑到当前技术发展趋势和未来潜力，我建议重点学习AI/机器学习相关技术，特别是大语言模型(LLM)相关的技术栈。原因如下：1.为什么选择AI/LLM？

数字沉思·2025-02-09 21:09

重拾二进制之魂：大语言模型与逆向工程的奇幻旅程

逆向工程，这门解构编译产物、还原软件真貌的神秘艺术，正迎来了一场革命性的变革——由大语言模型赋能的LLM4Decompile系统。

步子哥·2025-02-09 18:50

微软 LayoutLM：文档理解的强大工具

深入了解LayoutLM：文档理解的强大工具阅读时长：15分钟发布时间：2025-02-09近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM

·2025-02-09 18:35

探秘检索增强生成：上下文检索、混合搜索与密集检索全解析

探秘检索增强生成：上下文检索、混合搜索与密集检索全解析阅读时长：15分钟发布时间：2025-02-09近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎

·2025-02-09 18:33

从零开始构建一个大语言模型-第六章第一节

6.8将大语言模型用作垃圾邮件分类器本章内容涵盖介绍不同的大语言模型微调方法为文本分类准备数据集修改预训练大语言模型以进行微调使用微调后的大语言模型对新数据进行分类到目前为止，我们已经编写了大语言模型（LLM

释迦呼呼·2025-02-09 18:17

大模型 RAG 知识总结

在LLM已经具备了较强能力的基础上，仍然存在以下问题：幻觉问题：LLM文本生成的底层原理是基于概率的tokenbytoken的形式，因此会不可避免地产生“一本正经的胡说八道”的情况；时效性问题：LLM的规模越大

da pai ge·2025-02-09 16:38

llama.cpp的C语言API使用

它的源代码直接在github上下载即可：GitHub-ggerganov/llama.cpp:LLM

怎么这么多名字都被占了·2025-02-09 13:43

服务网格（Service Mesh）在LLM应用架构中的应用

文章关键词服务网格、LLM应用架构、微服务通信、控制平面、数据平面、性能优化、安全性摘要本文深入探讨了服务网格在大型语言模型（LLM）应用架构中的关键作用。

AI天才研究院·2025-02-09 11:32

走进LLM世界之LLM历史与发展

1.LLM的起源1.1NLP的早期研究自然语言处理（NLP）的历史可以追溯到20世纪50年代，当时科学家们开始尝试让计算机理解和生成人类语言。

我就是全世界·2025-02-09 11:26

DeepSeek-V3 Technical Report

本文是LLM系列文章，针对《DeepSeek-V3TechnicalReport》的翻译。

UnknownBody·2025-02-09 08:35

14.4K+ Star！GPT Researcher：一个基于AI的智能研究助手

GPTResearcher简介GPTResearcher[1]是一个基于大型语言模型（LLM）的自动化智能体，目标是对任何给定主题进行在线全面研究。

鱼满满记·2025-02-09 07:00

Langchain运行报错踩坑记录

fromlangchain_openaiimportChatOpenAIimportos#加载.env到环境变量fromdotenvimportload_dotenv,find_dotenv_=load_dotenv(find_dotenv())llm

pumpkin84514·2025-02-09 04:36

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

DeepSeek（DeepSeek-V3深度剖析：下一代AI模型的全面解读）最近在AI社区引起了不小的轰动，这要归功于它以相对较低的成本提供令人印象深刻的性能。这是深入了解大型语言模型LLMs如何训练的绝佳机会。本文将深入探讨LLMs的训练过程，特别是强化学习（ReinforcementLearning，RL）（深度解析DeepSeekR1：强化学习与知识蒸馏的协同力量）在这一领域的应用，从TRP

大模型之路·2025-02-08 20:03

【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

一、引言与背景在人工智能领域，大型语言模型（LLM）如DeepSeek以其卓越的自然语言理解和生成能力，推动了众多应用场景的发展。

后端研发Marion·2025-02-08 14:24

大语言模型应用指南：Gemini简介

1.背景介绍1.1大型语言模型的兴起近年来，随着计算能力的提升和数据量的爆炸式增长，大型语言模型（LLM）逐渐成为人工智能领域的研究热点。

AI天才研究院·2025-02-08 11:03

大语言模型多token预测技术

近年来，大语言模型（LLM）在自然语言处理领域取得了突破性进展，凭借其强大的语言理解和生成能力，在各种NLP任务中展现出惊人的性能。

deepdata_cn·2025-02-08 09:21

【RAG知识库】本地搭建chatgpt知识库

实现原理如下图所示，过程包括加载文件->读取文本->文本分割->文本向量化->问句向量化->在文本向量中匹配出与问句向量最相似的topk个->匹配出的文本作为上下文和问题一起添加到prompt中->提交给LLM

LLM教程·2025-02-08 06:23

【Ollama+Deepseek】本地化部署运行Deepseek模型

它专注于简化LLM的本地运行流程，无需复杂的配置即可在个人设备（如

·2025-02-08 06:32

DeepSeek-R1深度报告：基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享

DeepSeek-R1深度报告——50道相关面试题——深刻理解相关概念（DeepSeek-R1大模型+强化学习（RL）+推理能力）一、前言与背景铺垫在当今人工智能与大语言模型（LargeLanguageModel,LLM

快撑死的鱼·2025-02-08 05:19

【Ollama+Deepseek】本地化部署运行Deepseek模型

它专注于简化LLM的本地运行流程，无需复杂的配置即可在个人设备（如

·2025-02-08 02:59

Chapter4.1 Coding an LLM architecture

4ImplementingaGPTmodelfromScratchToGenerateText4.1CodinganLLMarchitecture4ImplementingaGPTmodelfromScratchToGenerateText本章节包含编写一个类似于GPT的大型语言模型（LLM

亲持红叶·2025-02-08 01:53

大模型(LLM)微调并不复杂，数据才是关键：3个实例详解数据准备

今天咱们聊聊一个听起来很高大上的词——微调（Fine-Tuning）。听说过吗？别担心，今天我们不打算深挖那些复杂的技术细节，而是要告诉你们一个简单的事实：微调其实一点都不复杂，真正的关键在于——数据！前排提示，文末有大模型AGI-CSDN独家资料包哦！在这篇文章里，我们不仅会深入浅出地介绍什么是微调，还会通过三个具体的实例，教你们如何准备高质量的数据集，让你们的模型表现出色。准备好了吗？让我们一

程序员二飞·2025-02-08 01:21

RAG和KAG：AI知识增强的两大“利器”

一文读懂RAG和KAG：AI知识增强的两大“利器”阅读时长：15分钟发布时间：2025-02-07近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎

·2025-02-07 13:53

LLM速览篇【91-120】

hjzhang75·2025-02-07 13:03

Deep-Seek 开源项目教程

该项目利用大型语言模型（LLM）处理大量数据源，以收集全面的实体列表。Deep-Seek不仅支持文本生成，还特别擅长数学、代码和推理任务。项目快速启动环境准备在开始之前，请确保您

毛炎宝Gardener·2025-02-07 08:34

【LLM】Ollama：本地大模型 WebAPI 调用

Ollama快速部署安装Docker：从Docker官网下载并安装。部署Ollama：使用以下命令进行部署：dockerrun-d-p11434:11434--nameollama--restartalwaysollama/ollama:latest进入容器并下载qwen2.5:0.5b模型：进入Ollama容器：dockerexec-itollamabash在容器内下载模型：ollamapull

m0_74824496·2025-02-07 07:55

探秘 DeepSeek：AI 领域的创新力量

公司自2023年成立以来，便将目光聚焦于大语言模型（LLM）和相关技术的开发，致力于在人工智能领域开辟出一片新天地。

秉寒·2025-02-07 04:35

专为RAG和AGENT而生的PDF解析新工具：PymuPDF4LLM

利用大模型（LLM），结合本地知识，开发RAG或者AGENT的应用，解析PDF文档几乎是不可避免的事情。多数开发者可能习惯使用LlamaParse。这个工具虽然可以用，但总有不满意之处。

CS创新实验室·2025-02-07 03:56

Ollama安装部署deepseek

llama3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3模型运行模型搭建Web环境OllamaOllama是一个开源的大型语言模型服务工具，旨在帮助用户在本地环境中部署和运行大规模预训练语言模型（LLM

angel725·2025-02-07 02:53

使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署

使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署我们将探讨如何使用DeepSeekR1（一种针对结构化任务优化的开源推理模型）和Ollama（一种用于在本地运行LLM的框架）构建功能齐全的

·2025-02-07 02:10

大模型RAG优化方案_融合bm25和语义检索

写在前面检索增强生成(Retrieval-AugmentedGeneration,RAG)是一种将检索(Retrieval)和生成(Generation)相结合的技术，它利用检索到的相关信息来增强大型语言模型(LLM

kakaZhui·2025-02-06 23:31

Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM

论文信息标题：UnifyingLargeLanguageModelsandKnowledgeGraphs:ARoadmap作者：ShiruiPan摘要LLMs，例如chatGPT和GPT4，由于其涌现能力和泛化性，对自然语言理解和人工智能领域产生了新的冲击。然而，LLMs是一个黑箱模型，往往缺乏捕获和获得事实知识。相反，知识图谱，例如维基百科等，是有结构模型。存储着丰富的事实知识。KGs可以通过提

笨cc·2025-02-06 22:23

必知！10大机器学习算法

——吴恩达近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】1.K最近邻（KNN）KNN是一种简单却强大的分类算法

·2025-02-06 21:56

高效抽取PDF文件打造RAG，从LlamaParse转向PymuPDF4llm

PymuPDF4llm：大型语言模型的高效PDF数据处理利器。PymuPDF4llm是专为大型语言模型设计的强大工具，能够将杂乱的PDF数据整理得井井有条，为你的AI项目提供有力支持。

小天才学习机打游戏·2025-02-06 19:38

LLM知识蒸馏代码讲解及训练实验

LLM知识蒸馏代码讲解及训练实验知识蒸馏简单讲即使用大规模参数的模型对小规模参数模型进行蒸馏，且不是简单的只使用答案，是需要两个模型的logprob进行交互的，故两个模型的vocabsize必须是一样的

淡水，·2025-02-06 18:33

【大模型LLM面试合集】训练数据_数据格式

数据格式1.SFT（有监督微调）的数据集格式？对于大语言模型的训练中，SFT（SupervisedFine-Tuning）的数据集格式可以采用以下方式：输入数据：输入数据是一个文本序列，通常是一个句子或者一个段落。每个样本可以是一个字符串或者是一个tokenized的文本序列。标签数据：标签数据是与输入数据对应的标签或类别。标签可以是单个类别，也可以是多个类别的集合。对于多分类任务，通常使用one

X.AI666·2025-02-06 18:28

推荐频道

闻达LLM

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

动手学大语言模型LLM-02

如何在 VSCode 中使用通义灵码（Tongyi Lingma）智能编程助手

【AI学习】LLM的发展方向

SEO友好架构提升LLM应用的可发现性

【Neo4j 】学习笔记：GraphRAG 宣言：为 GenAI 添加知识

AI系列：大语言模型的function calling（下）- 使用LangChain

LLM 中的 vocabulary 和 embedding vector

GraphRAG如何使用ollama提供的llm model 和Embedding model服务构建本地知识库

TC-LLaVA论文笔记

大模型学习笔记 - LLM 对齐优化算法 DPO

AI学习专题（一）LLM技术路线

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

机器学习回归评估指标全解析：如何衡量模型的准确性？回归评估指标-MSE、MAE、RMSE、R²分数

为什么要学习AI/机器学习

重拾二进制之魂：大语言模型与逆向工程的奇幻旅程

微软 LayoutLM：文档理解的强大工具

探秘检索增强生成：上下文检索、混合搜索与密集检索全解析

从零开始构建一个大语言模型-第六章第一节

大模型 RAG 知识总结

llama.cpp的C语言API使用

服务网格（Service Mesh）在LLM应用架构中的应用

走进LLM世界之LLM历史与发展

DeepSeek-V3 Technical Report

14.4K+ Star！GPT Researcher：一个基于AI的智能研究助手

Langchain运行报错踩坑记录

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

大语言模型应用指南：Gemini简介

大语言模型多token预测技术

【RAG知识库】本地搭建chatgpt知识库

【Ollama+Deepseek】本地化部署运行Deepseek模型

DeepSeek-R1深度报告：基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享

【Ollama+Deepseek】本地化部署运行Deepseek模型

Chapter4.1 Coding an LLM architecture

大模型(LLM)微调并不复杂，数据才是关键：3个实例详解数据准备

RAG和KAG：AI知识增强的两大“利器”

LLM速览篇【91-120】

Deep-Seek 开源项目教程

【LLM】Ollama：本地大模型 WebAPI 调用

探秘 DeepSeek：AI 领域的创新力量

专为RAG和AGENT而生的PDF解析新工具：PymuPDF4LLM

Ollama安装部署deepseek

使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署

大模型RAG优化方案_融合bm25和语义检索

Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM

必知！10大机器学习算法

高效抽取PDF文件打造RAG，从LlamaParse转向PymuPDF4llm

LLM知识蒸馏代码讲解及训练实验

【大模型LLM面试合集】训练数据_数据格式