LLM 第10页

【Ollama+Deepseek】本地化部署运行Deepseek模型

·2025-02-08 02:59

Chapter4.1 Coding an LLM architecture

4ImplementingaGPTmodelfromScratchToGenerateText4.1CodinganLLMarchitecture4ImplementingaGPTmodelfromScratchToGenerateText本章节包含编写一个类似于GPT的大型语言模型（LLM

亲持红叶·2025-02-08 01:53

大模型(LLM)微调并不复杂，数据才是关键：3个实例详解数据准备

今天咱们聊聊一个听起来很高大上的词——微调（Fine-Tuning）。听说过吗？别担心，今天我们不打算深挖那些复杂的技术细节，而是要告诉你们一个简单的事实：微调其实一点都不复杂，真正的关键在于——数据！前排提示，文末有大模型AGI-CSDN独家资料包哦！在这篇文章里，我们不仅会深入浅出地介绍什么是微调，还会通过三个具体的实例，教你们如何准备高质量的数据集，让你们的模型表现出色。准备好了吗？让我们一

程序员二飞·2025-02-08 01:21

RAG和KAG：AI知识增强的两大“利器”

一文读懂RAG和KAG：AI知识增强的两大“利器”阅读时长：15分钟发布时间：2025-02-07近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎

·2025-02-07 13:53

LLM速览篇【91-120】

hjzhang75·2025-02-07 13:03

Deep-Seek 开源项目教程

该项目利用大型语言模型（LLM）处理大量数据源，以收集全面的实体列表。Deep-Seek不仅支持文本生成，还特别擅长数学、代码和推理任务。项目快速启动环境准备在开始之前，请确保您

毛炎宝Gardener·2025-02-07 08:34

【LLM】Ollama：本地大模型 WebAPI 调用

Ollama快速部署安装Docker：从Docker官网下载并安装。部署Ollama：使用以下命令进行部署：dockerrun-d-p11434:11434--nameollama--restartalwaysollama/ollama:latest进入容器并下载qwen2.5:0.5b模型：进入Ollama容器：dockerexec-itollamabash在容器内下载模型：ollamapull

m0_74824496·2025-02-07 07:55

探秘 DeepSeek：AI 领域的创新力量

公司自2023年成立以来，便将目光聚焦于大语言模型（LLM）和相关技术的开发，致力于在人工智能领域开辟出一片新天地。

秉寒·2025-02-07 04:35

专为RAG和AGENT而生的PDF解析新工具：PymuPDF4LLM

利用大模型（LLM），结合本地知识，开发RAG或者AGENT的应用，解析PDF文档几乎是不可避免的事情。多数开发者可能习惯使用LlamaParse。这个工具虽然可以用，但总有不满意之处。

CS创新实验室·2025-02-07 03:56

Ollama安装部署deepseek

llama3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3模型运行模型搭建Web环境OllamaOllama是一个开源的大型语言模型服务工具，旨在帮助用户在本地环境中部署和运行大规模预训练语言模型（LLM

angel725·2025-02-07 02:53

使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署

使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署我们将探讨如何使用DeepSeekR1（一种针对结构化任务优化的开源推理模型）和Ollama（一种用于在本地运行LLM的框架）构建功能齐全的

·2025-02-07 02:10

大模型RAG优化方案_融合bm25和语义检索

写在前面检索增强生成(Retrieval-AugmentedGeneration,RAG)是一种将检索(Retrieval)和生成(Generation)相结合的技术，它利用检索到的相关信息来增强大型语言模型(LLM

kakaZhui·2025-02-06 23:31

Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM

论文信息标题：UnifyingLargeLanguageModelsandKnowledgeGraphs:ARoadmap作者：ShiruiPan摘要LLMs，例如chatGPT和GPT4，由于其涌现能力和泛化性，对自然语言理解和人工智能领域产生了新的冲击。然而，LLMs是一个黑箱模型，往往缺乏捕获和获得事实知识。相反，知识图谱，例如维基百科等，是有结构模型。存储着丰富的事实知识。KGs可以通过提

笨cc·2025-02-06 22:23

必知！10大机器学习算法

——吴恩达近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】1.K最近邻（KNN）KNN是一种简单却强大的分类算法

·2025-02-06 21:56

高效抽取PDF文件打造RAG，从LlamaParse转向PymuPDF4llm

PymuPDF4llm：大型语言模型的高效PDF数据处理利器。PymuPDF4llm是专为大型语言模型设计的强大工具，能够将杂乱的PDF数据整理得井井有条，为你的AI项目提供有力支持。

小天才学习机打游戏·2025-02-06 19:38

LLM知识蒸馏代码讲解及训练实验

LLM知识蒸馏代码讲解及训练实验知识蒸馏简单讲即使用大规模参数的模型对小规模参数模型进行蒸馏，且不是简单的只使用答案，是需要两个模型的logprob进行交互的，故两个模型的vocabsize必须是一样的

淡水，·2025-02-06 18:33

【大模型LLM面试合集】训练数据_数据格式

数据格式1.SFT（有监督微调）的数据集格式？对于大语言模型的训练中，SFT（SupervisedFine-Tuning）的数据集格式可以采用以下方式：输入数据：输入数据是一个文本序列，通常是一个句子或者一个段落。每个样本可以是一个字符串或者是一个tokenized的文本序列。标签数据：标签数据是与输入数据对应的标签或类别。标签可以是单个类别，也可以是多个类别的集合。对于多分类任务，通常使用one

X.AI666·2025-02-06 18:28

大型推理模型（LRM）的比较 OpenAI DeepSeek R1 Gemini 2.0

LRM）的比较OpenAIDeepSeekR1Gemini2.0阅读时长：25分钟发布时间：2025-02-06近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM

·2025-02-06 17:20

Python用langchain、OpenAI大语言模型LLM情感分析AAPL股票新闻数据及提示工程优化应用

全文链接：https://tecdat.cn/?p=39614本文主要探讨了如何利用大语言模型（LLMs）进行股票分析。通过使用提供的股票市场和金融新闻获取数据，结合Python中的相关库，如Pandas、langchain等，实现对股票新闻的情感分析。利用大语言模型构建情感分析模型，通过提示工程等技术优化模型，最终通过可视化展示股票市场的情感倾向，为股票投资决策提供参考。关键词大语言模型；股票分

·2025-02-06 17:10

LangChain 深入指南：构建强大的 LLM 应用的核心架构

引言在当今的人工智能领域，构建强大且可扩展的语言模型（LLM）应用程序需要扎实的技术框架支持。LangChain是这样一个框架，旨在简化语言模型的部署、集成和运维。

nseejrukjhad·2025-02-06 16:19

大模型面试必看！超详细面经指南+答案，轻松拿Offer！2025大模型上岸就靠它了！

[x]4.大模型LLM的架构介绍？[x]大模型（LLMs）进阶面[x]1.llama输入句子长度理论上可以无限长吗？[x]1.什么是LLMs复读机问题？[x]2.为什么会出现LLMs复读机问题？

AI大模型-大飞·2025-02-06 16:47

构建安全可靠的LLM应用架构

《构建安全可靠的LLM应用架构》关键词：大型语言模型（LLM），应用架构，安全性，可靠性，设计原则摘要：本文旨在深入探讨如何构建一个安全可靠的大型语言模型（LLM）应用架构。

AI天才研究院·2025-02-06 16:15

从零开始构建一个大语言模型-第五章第五节

第五章目录5.1评估生成文本模型5.2训练一个LLM5.3控制随机性的解码策略5.4在PyTorch中加载和保存模型权重5.5从OpenAI加载预训练权重5.5从OpenAI加载预训练权重此前，我们使用一个由一本短篇小说集组成的有限数据集训练了一个小型

释迦呼呼·2025-02-06 15:41

DeepSeek-R1真算得上开源吗？

OpenAIo1模型证明，当LLM在推理时，通过增加计算量进行类似训练后，它们在数学、编程和逻辑等推理任务上的表现显著提升。然而，OpenAI推理模型的训练方法一直是秘密。

·2025-02-06 13:37

KRAIL: A Knowledge-Driven Framework for Base Human Reliability Analysis Integrating IDHEAS

本文是LLM系列文章，针对《KRAIL:AKnowledge-DrivenFrameworkforBaseHumanReliabilityAnalysisIntegratingIDHEASandLargeLanguageModels

UnknownBody·2025-02-06 12:15

有趣的项目--汇总

文章目录前言一、AI类二、前言持续记录有意思的项目，欢迎大家讨论一、AI类openglass+ollama：链接:OpenGlassAI眼镜的环境配置与实现InvidiaJetson+LLM：链接:生成式人工智能应用

cladel·2025-02-06 09:00

SGlang 专为大模型设计的高效服务框架

SGlang是一种专为大型语言模型（LLM）和视觉语言模型（VLM）设计的高效服务框架，旨在提升模型的推理速度和灵活性。

kcarly·2025-02-06 08:52

llama.cpp LLM_ARCH_DEEPSEEK and LLM_ARCH_DEEPSEEK2

`LLM_ARCH_DEEPSEEK`and`LLM_ARCH_DEEPSEEK2`2.`LLM_ARCH_DEEPSEEK`and`LLM_ARCH_DEEPSEEK2`3.

Yongqiang Cheng·2025-02-06 06:42

使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南

使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南引言环境搭建安装vLLM安装依赖库下载模型启动vLLM服务器总结参考引言近年来，随着大规模语言模型（LLM）的快速发展，如何高效地进行模型推理成为了一个热门话题

engchina·2025-02-06 03:40

大模型产品化第一年：战术、运营与战略

作者|EugeneYan、BryanBischof等OneFlow编译翻译｜宛子琳、张雪聃、杨婷题图由SiliconCloud平台生成这是一个激动人心的时代，所有人都能够利用语言大模型（LLM）进行各种各样的产品构建

OneFlow深度学习框架·2025-02-06 03:39

前端大模型入门：编码(Tokenizer)和嵌入(Embedding)解析

本文介绍了大规模语言模型（LLM）中的两个核心概念：Tokenizer和Embedding。

大模型玩家·2025-02-06 03:38

大语言模型轻量化：知识蒸馏的范式迁移与工程实践

摘要在大型语言模型（LLM）主导人工智能发展的当下，模型参数量与推理成本的指数级增长已成为制约技术落地的核心瓶颈。

LucianaiB·2025-02-06 02:04

大规模语言模型从理论到实践 DeepSpeed实践

大规模语言模型从理论到实践DeepSpeed实践文章目录大规模语言模型从理论到实践DeepSpeed实践1.背景介绍1.1大规模语言模型的兴起1.2训练和部署LLM的挑战1.3DeepSpeed：赋能LLM

AI天才研究院·2025-02-06 01:59

DeepSeek：探索未来的人工智能模型与技术

个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言近年来，大语言模型（LLM）迅速发展，推动了人工智能在多个领域的应用。

一ge科研小菜鸡·2025-02-05 22:32

LLM大模型RAG内容安全合规检查

1.了解内容安全合规涉及的范围我们先回顾一下智能答疑机器人的问答流程。问答流程主要包括用户、智能答疑机器人、知识库、大语言模型这四个主体。涉及内容安全的关键阶段主要有：输入阶段：用户发起提问。输出阶段：机器人返回回答。知识库召回阶段：从知识库中召回相关的topK文本。针对RAG应用，内容安全合规检查方案的设计将围绕这三个阶段展开。为此，我们可以设计一套通用的合规检查机制，支持不同内容类型的检查，且

MichaelIp·2025-02-05 21:57

51-59 CVPR 2024 | ChatSiM：Editable Scene Simulation for Autonomous Driving via Collaborative LLM

上海交通大学、上海人工智能实验室、卡内基梅隆大学和清华大学联合发布EditableSceneSimulationforAutonomousDrivingviaCollaborativeLLM-Agents，基于LLM

深圳季连AIgraphX·2025-02-05 18:10

大语言模型本地化部署+可视化微调

随着chatgpt的爆火，国内外的大语言模型（LargeLanguageModel，LLM）争先恐后，高速发展，人工智能技术也从传统的判别式人工智能逐渐转向了生成式人工智能，LLM作为AI的一种具体表现形式

科研小fw·2025-02-05 18:09

TensorRT-LLM保姆级教程（一）-快速入门

本系列将针对TensorRT-LLM推理进行讲解。本文为该系列第一篇，将简要概述TensorRT-LLM的基本特性。另外，我撰写的大模型相关的博客及配套代码均整理放置在Github：llm-act

大模型部署·2025-02-05 18:38

长上下文大模型会让检索增强生成（RAG）过时吗？

大模型（LLM）的迅速发展对人工智能领域，尤其是自然语言处理（NLP）产生了重大影响。传统上，像检索增强生成（RAG）这样的技术通过允许模型动态访问外部知识源，在提升大语言模型能力方面发挥了重要作用。

·2025-02-05 18:38

Spring AI 智能体通过 MCP 集成本地文件数据

作者：刘军ModelContextProtocol（MCP）简介模型上下文协议（即ModelContextProtocol，MCP）[1]是一个开放协议，它规范了应用程序如何向大型语言模型（LLM）提供上下文

·2025-02-05 18:37

LLM 算法工程师的速成指南：微调、强化学习微调与偏好微调

OpenAI近期在直播中，提到了两个新的概念：①强化学习微调（ReinforcementFine-Tuning）：仅需少量高质量数据（数十到数千个），模型即可通过强化学习处理复杂任务。②偏好微调(PreferenceFine-Tuning,PFT)：采用直接偏好优化(例如DirectPreferenceOptimization,DPO)算法，通过比较不同的模型输出，让AI能够学习并区分“更好”的回

大模型玩家·2025-02-05 16:24

用 Python 微调 DeepSeek R1

用Python微调DeepSeekR1阅读时长：15分钟发布时间：2025-02-05近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎

·2025-02-05 13:24

DeepSeek-R1 低成本训练的根本原因是？

在人工智能领域，大语言模型（LLM）正以前所未有的速度发展，驱动着自然语言处理、内容生成、智能客服等众多应用的革新。

明哲AI·2025-02-05 11:10

从 0 到 1 掌握 LangChain Agents：自定义工具 + LLM 打造智能工作流！

LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手动评估与LLM

吴师兄大模型·2025-02-05 08:53

大语言模型LLM分布式训练：TensorFlow攻略与深度解析（LLM系列04）

文章目录大语言模型LLM分布式训练：TensorFlow攻略与深度解析（LLM系列04）1.引言2.TensorFlow分布式训练基础概念3.TensorFlow中LLM分布式训练的关键技术及应用4.利用

North_D·2025-02-05 08:20

DeepSeek-R1全面超越OpenAI o1：开源大模型训练范式革新

其中，2017年Google发布的“AttentionIsAllYouNeed”论文奠定了神经网络架构的重要基础，推动了大规模语言模型（LLM）的突破。

·2025-02-05 02:16

使用Ollama本地化部署DeepSeek

1、Ollama简介Ollama是一个开源的本地化大模型部署工具，旨在简化大型语言模型（LLM）的安装、运行和管理。

·2025-02-05 02:15

DeepSeek 微调变得简单：使用 Python 创建自定义 AI 模型学习针对所有用例微调 DeepSeek R1 模型

通过本文，您将了解如何将通用的DeepSeekR1模型转变为专门的、特定领域的LLM。

知识大胖·2025-02-04 22:09

深度学习-98-大语言模型LLM之基于langchain的代理create_react_agent工具

文章目录1Agent代理1.1代理的分类1.2ReAct和Structuredchat2代理应用ReAct2.1创建工具2.1.1嵌入模型2.1.2创建检索器2.1.3测试检索结果2.1.4创建工具列表2.2初始化大模型2.3创建Agent2.4运行Agent3参考附录1Agent代理Agent代理的核心思想是使用语言模型来选择要采取的一系列动作。(1)在链中，动作序列是硬编码的。(2)在代理中，

皮皮冰燃·2025-02-04 18:46

Kimi k1.5 ： OpenAI-o1 级多模态模型

阅读时长：15分钟发布时间：2025-02-04近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文

·2025-02-04 18:36

推荐频道

LLM