llms 第3页

多模态大模型（LMMs）与大语言模型（LLMs）的比较

前言现在的大模型分为两大类：大语言模型（LargeLanguageModels，简称LLMs）和多模态大模型（LargeMultimodalModels，简称LMMs）。

大F的智能小课·2025-02-13 23:02

如何训练LLMs进行“思考”（如o1和DeepSeek-R1）

如何训练LLMs进行“思考”（如o1和DeepSeek-R1）阅读时长：19分钟发布时间：2025-02-13近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM

·2025-02-13 16:07

使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型

在这篇技术文章中，我们将探讨如何使用llama-cpp-python（llama.cpp的Python绑定）在本地运行大语言模型（LLMs）。

hgSdaegva·2025-02-12 20:16

llama3简介与国内最快体验方式

Meta公司研发并推出了MetaLlama3系列大型语言模型（LLMs），该系列包括8B和70B参数量的预训练及指令调优生成文本模型。

weixin_40941102·2025-02-12 15:08

Java程序员Python一小时速成

背景由于最近要开发一些AILLM（LargeLanguageModel大语言模型）应用程序，然后又想使用LangChain（LangChain是一个用于构建和操作大语言模型（LLMs）的框架，旨在帮助开发者更方便地集成和使用各种

BossFriday·2025-02-12 15:04

大语言模型多代理协作（MACNET）

研究背景与动机：大语言模型（LLMs）因神经缩放定律展现出强大能力，

ZhangJiQun&MXP·2025-02-12 00:51

【NLP算法面经】NLP算法面经 -- 腾讯 VS 美团（附面题）

博客主页：[青松]目录【NLP百面百过】大模型算法高频面题（全面整理ʘ‿ʘ）一、大模型（LLMs）基础面大模型（LLMs）架构篇注意力机制（Attention）篇Transformer理论篇二、大模型微调面有监督微调

青松ᵃⁱ·2025-02-11 13:37

《大语言模型：原理与工程实践》书籍推荐及详细说明

随着人工智能技术的发展，尤其是深度学习技术的进步，大规模语言模型（LargeLanguageModels,LLMs）已成为自然语言处理领域的研究热点。

大模型入门教程·2025-02-11 01:57

代码星辰：探索 benchmark 构建的奥秘之旅

而在这片“代码星海”中，如何评估大语言模型（LLMs）在编程任务上的表现，就像天文学家借助望远镜探索宇宙奥秘一般关键。近日，一篇题为《HowShouldIBuildABenchmark?

步子哥·2025-02-10 07:56

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域，大型语言模型（LLMs）的应用越来越广泛。

qq_37836323·2025-02-10 01:37

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读

文章目录前言一、摘要二、引言三、贡献1.贡献后训练：基础模型的大规模强化学习蒸馏：较小的模型也可以很强大2.评估结果概览reasoningtasksknowledgeohters四、方法1.Overview2.DeepSeek-R1-Zero:ReinforcementLearningontheBaseModelReinforcementLearningAlgorithm(GRPO重点)Rewar

tangjunjun-owen·2025-02-09 23:54

大模型 RAG 知识总结

RAG（Retrieval-AugmentedGeneration）面一、LLMs已经具备了较强能力了，存在哪些不足点？

da pai ge·2025-02-09 16:38

DeLLMa框架：优化复杂决策的新路径

标题：DeLLMa框架：优化复杂决策的新路径文章信息摘要：DeLLMa框架通过整合大型语言模型（LLMs）和结构化数据，优化了在不确定性条件下的决策过程，特别是在处理复杂决策问题时，能够增强决策的严谨性和精确性

XianxinMao·2025-02-09 16:07

蒸馏：让DeepSeek用“移魂大法”增强你的小模型

蒸馏：让DeepSeek用“移魂大法”增强你的小模型原创格知致能寒武纪人工智能2025年02月06日00:48北京前言在大型语言模型（LLMs）时代，知识蒸馏成为一种重要方法，用于将能力强大的、参数规模庞大的

AI生成曾小健·2025-02-09 11:58

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

这是深入了解大型语言模型LLMs如何训练的绝佳机会。

大模型之路·2025-02-08 20:03

【Ollama+Deepseek】本地化部署运行Deepseek模型

二、Ollama下载安装Ollama是一个开源工具，用于在本地计算机上快速部署和运行大型语言模型（LLMs）。它专注于简化LLM的本地运行流程，无需复杂的配置即可在个人设备（如

·2025-02-08 06:32

AI大语言模型的全面解读

大语言模型（LargeLanguageModels,LLMs）无疑是近年来最耀眼的星辰之一。

草莓屁屁我不吃·2025-02-08 05:48

【Ollama+Deepseek】本地化部署运行Deepseek模型

二、Ollama下载安装Ollama是一个开源工具，用于在本地计算机上快速部署和运行大型语言模型（LLMs）。它专注于简化LLM的本地运行流程，无需复杂的配置即可在个人设备（如

·2025-02-08 02:59

【论文阅读】DeepSeek-R1：通过强化学习激励LLMs的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL

DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearningDeepSeek-R1：通过强化学习激励LLMs的推理能力

AI天才研究院·2025-02-07 22:05

大语言模型原理基础与前沿高效的MoE架构

大语言模型原理基础与前沿高效的MoE架构关键词：大语言模型，MoE架构，参数高效微调，分布式训练，模型压缩，推理加速1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大语言模型（LargeLanguageModels，LLMs

AI架构设计之禅·2025-02-07 13:39

LLM速览篇【91-120】

hjzhang75·2025-02-07 13:03

产品经理的人工智能课 02 - 自然语言处理

2一个NLP算法的例子——n-gram模型3预处理与重要概念3.1分词Token3.2词向量化表示与Word2Vec4与大语言模型的交互过程参考链接大语言模型（LargeLanguageModels,LLMs

平头某·2025-02-07 05:12

专为RAG和AGENT而生的PDF解析新工具：PymuPDF4LLM

为此，就出现了一个专为大语言模型（LLMs，LargeLanguageModels）设计的PDF解析的大杀器：PymuPDF4llm。

CS创新实验室·2025-02-07 03:56

Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM

论文信息标题：UnifyingLargeLanguageModelsandKnowledgeGraphs:ARoadmap作者：ShiruiPan摘要LLMs，例如chatGPT和GPT4，由于其涌现能力和泛化性

笨cc·2025-02-06 22:23

[论文笔记] Deepseek技术报告

1.总体概述背景与目标报告聚焦于利用强化学习（RL）提升大型语言模型（LLMs）的推理能力，旨在探索在不依赖大规模监督微调（SFT）的情况下，模型如何自我进化并形成强大的推理能力。

心心喵·2025-02-06 22:53

Python用langchain、OpenAI大语言模型LLM情感分析AAPL股票新闻数据及提示工程优化应用

p=39614本文主要探讨了如何利用大语言模型（LLMs）进行股票分析。

·2025-02-06 17:10

大模型面试必看！超详细面经指南+答案，轻松拿Offer！2025大模型上岸就靠它了！

目录[x]大模型（LLMs）基础面[x]1.目前主流的开源模型体系有哪些？[x]2.prefixLM和causalLM区别是什么？[x]3.涌现能力是啥原因？[x]4.大模型LLM的架构介绍？

AI大模型-大飞·2025-02-06 16:47

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索在人工智能领域，大型语言模型（LLMs）的发展日新月异，其在自然语言处理和生成任务中的表现逐渐接近人类水平。

kaichu2·2025-02-06 03:07

什么是大模型框架？常用的大模型框架盘点对比

什么是大模型框架大模型框架是指用于训练、推理和部署大型语言模型（LLMs）的软件工具和库。

AI产品经理·2025-02-05 21:25

关于大模型 AGI 应知应会＿生在AI发展的时代

一、大模型的核心概念与特点（一）什么是大模型大模型（LargeLanguageModels，LLMs）是指具有大规模参数和复杂计算结构的深度学习模型，通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数

森焱森·2025-02-05 10:38

【memgpt】letta 课程1/2：从头实现一个自我编辑、记忆和多步骤推理的代理

llms-as-operating-systems-agent-memoryllms-as-operating-systems-agent-memory内存操作系统的内存管理

等风来不如迎风去·2025-02-03 23:06

M-Ped: Multi-Prompt Ensemble Decoding for Large Language Models

M-Ped：大型语言模型的多提示集成解码摘要1引言2方法3实验4研究5相关工作6结论摘要随着大型语言模型（LLMs）在自然语言处理（NLP）领域的广泛应用，提高其性能已成为研究热点。

UnknownBody·2025-02-03 11:36

在Windows上用Llama Factory微调Llama 3的基本操作

Readme：GitHub-hiyouga/LLaMA-Factory:UnifyEfficientFine-Tuningof100+LLMsUnifyEfficientFine-Tuningof100+LLMs.Contribu

蛐蛐蛐·2025-02-02 13:16

开源LLMs导览：工作原理、顶级LLM列表对比

万俟淋曦·2025-02-01 23:11

【AI知识点】三种不同架构的大语言模型（LLMs）的区别

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】在自然语言处理（NLP）中，预训练语言模型（LLMs,LargeLanguageModels）通常基于不同的架构，如仅编码器的模型（Encoder-only

AI完全体·2025-02-01 23:09

深入探索Llama.cpp：在LangChain中使用llama-cpp-python

深入探索Llama.cpp：在LangChain中使用llama-cpp-python随着大语言模型（LLMs）的普及，开发者需要更有效的方法来部署和使用这些模型。

dfvcbipanjr·2025-02-01 16:10

表格化数据处理中大语言模型的微调优化策略研究

ResearchonFine-TuningOptimizationStrategiesforLargeLanguageModelsinTabularDataProcessing论文主要内容这篇论文的主要内容是研究大型语言模型（LLMs

C7211BA·2025-01-31 23:25

使用大语言模型在表格化网络安全数据中进行高效异常检测

论文链接Efficientanomalydetectionintabularcybersecuritydatausinglargelanguagemodels论文主要内容这篇论文介绍了一种基于大语言模型（LLMs

C7211BA·2025-01-31 23:54

具身智能VLA（视觉-语言-动作）入门+RTX4060+Ubuntu22.04

第一个阶段：学习transformer和大模型：我喜欢刷微信的短视频，看到了入门的课程：GitHub-rasbt/LLMs-from-scra

铮铭·2025-01-31 19:51

DeepSeek R1与OpenAI o1深度对比

企业智能化升级教育与培训数据分析与智能决策部署与集成DeepSeekR1OpenAIo1伦理考量DeepSeekR1OpenAIo1未来展望DeepSeekR1OpenAIo1引言在科技飞速发展的当下，人工智能领域中的大型语言模型（LLMs

码事漫谈·2025-01-31 13:01

论文笔记（七十）DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（二）

DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning（二）文章概括摘要：2.方法2.3.DeepSeek-R1：冷启动强化学习2.3.1.冷启动2.3.2.面向推理的强化学习2.3.3.拒绝采样与监督微调2.3.4.面向所有场景的强化学习2.4.蒸馏：赋予小模型推理能力文章概括引用：@article{g

墨绿色的摆渡人·2025-01-31 07:01

[特殊字符]文献阅读分享：《负面情绪更吸睛？利用大型语言模型重构新闻推荐系统中的情感框架》

随着人工智能技术的发展，大型语言模型（LLMs）逐渐被引入新闻生产过程，为新闻框架的重构提供了新的可能性。本文通过实验研究，探讨了基于LLM的情感框架重构对用户情感、参与度和付费意愿的影响。相关工

Sheakan·2025-01-30 22:20

github最强Chatbox AI 模型桌面，支持 ChatGPT、Claude等主流模型，适用于 Win、Linux等，总结文档图片并互动，智能编程，AI实时联网搜索与查询，图片生成，科研写作等

github地址：GitHub-Bin-Huang/chatbox:User-friendlyDesktopClientAppforAIModels/LLMs(GPT,

struggle2025·2025-01-30 18:12

大型语言模型构建指南：从头开始构建大语言模型《Build a Large Language Model (From Scratch)》免费PDF

通过从头开始构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）！一、构建大型语言模型（从头开始）在《构建大型语言模型（从头开始）》中，你将了解如何LLMs从内到外工作。

AGI大模型学习·2025-01-30 05:34

书籍推荐：《从零构建大型语言模型》附免费PDF下载

通过从头开始构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）！一、构建大型语言模型（从头开始）在《构建大型语言模型（从头开始）》中，你将了解如何LLMs从内到外工作。

大模型入门学习·2025-01-30 05:33

Deepseek爆火背后的多Token技术预测

近年来，大语言模型（LLMs）的发展如火如荼，它们在聊天机器人、文档生成、代码编写等领域大放异彩。然而，随着模型规模的增加，生成效率也成为了一大瓶颈。

明哲AI·2025-01-29 22:41

开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-LangGraph-链式处理（一）

LangGraph作为一种创新的架构，其链式处理机制为充分发挥LLMs的潜力提供了新的途径。

开源技术探险家·2025-01-29 21:33

DeepSeek R1：中国AI黑马的崛起与挑战

推理能力的全方位跃升基准测试：超越顶尖闭源模型蒸馏技术：小模型的逆袭行业启示：AGI之路的新范式纯RL训练的价值与挑战蒸馏技术的普惠意义开源生态的推动力未来展望：从推理到通用智能结语在人工智能领域，大型语言模型（LLMs

码事漫谈·2025-01-28 16:13

构建桌面聊天助手：Mistral AI、LangChain 和 Tkinter 的结合

在人工智能（AI）技术日新月异的今天，大型语言模型（LLMs）和LangChain成为了炙手可热的话题。

花生糖@·2025-01-27 09:08

大语言模型应用指南：OpenAI大语言模型简介

大语言模型应用指南：OpenAI大语言模型简介1.背景介绍1.1问题的由来在过去几年中,自然语言处理(NLP)领域取得了长足的进步,这主要归功于大型语言模型(LargeLanguageModels,LLMs

AI大模型应用之禅·2025-01-26 15:02

推荐频道

llms

多模态大模型（LMMs）与大语言模型（LLMs）的比较

如何训练LLMs进行“思考”（如o1和DeepSeek-R1）

使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型

llama3简介与国内最快体验方式

Java程序员Python一小时速成

大语言模型多代理协作（MACNET）

【NLP算法面经】NLP算法面经 -- 腾讯 VS 美团（附面题）

《大语言模型：原理与工程实践》书籍推荐及详细说明

代码星辰：探索 benchmark 构建的奥秘之旅

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读

大模型 RAG 知识总结

DeLLMa框架：优化复杂决策的新路径

蒸馏：让DeepSeek用“移魂大法”增强你的小模型

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

【Ollama+Deepseek】本地化部署运行Deepseek模型

AI大语言模型的全面解读

【Ollama+Deepseek】本地化部署运行Deepseek模型

【论文阅读】DeepSeek-R1：通过强化学习激励LLMs的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL

大语言模型原理基础与前沿 高效的MoE架构

LLM速览篇【91-120】

产品经理的人工智能课 02 - 自然语言处理

专为RAG和AGENT而生的PDF解析新工具：PymuPDF4LLM

Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM

[论文笔记] Deepseek技术报告

Python用langchain、OpenAI大语言模型LLM情感分析AAPL股票新闻数据及提示工程优化应用

大模型面试必看！超详细面经指南+答案，轻松拿Offer！2025大模型上岸就靠它了！

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索

什么是大模型框架？常用的大模型框架盘点对比

关于大模型 AGI 应知应会＿生在AI发展的时代

【memgpt】letta 课程1/2：从头实现一个自我编辑、记忆和多步骤推理的代理

M-Ped: Multi-Prompt Ensemble Decoding for Large Language Models

在Windows上用Llama Factory微调Llama 3的基本操作

开源LLMs导览：工作原理、顶级LLM列表对比

【AI知识点】三种不同架构的大语言模型（LLMs）的区别

深入探索Llama.cpp：在LangChain中使用llama-cpp-python

表格化数据处理中大语言模型的微调优化策略研究

使用大语言模型在表格化网络安全数据中进行高效异常检测

具身智能VLA（视觉-语言-动作）入门+RTX4060+Ubuntu22.04

DeepSeek R1与OpenAI o1深度对比

论文笔记（七十）DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（二）

[特殊字符]文献阅读分享：《负面情绪更吸睛？利用大型语言模型重构新闻推荐系统中的情感框架》

github最强Chatbox AI 模型桌面，支持 ChatGPT、Claude等主流模型，适用于 Win、Linux等，总结文档图片并互动，智能编程，AI实时联网搜索与查询，图片生成，科研写作等

大型语言模型构建指南：从头开始构建大语言模型《Build a Large Language Model (From Scratch)》免费PDF

书籍推荐：《从零构建大型语言模型》附免费PDF下载

Deepseek爆火背后的多Token技术预测

开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-LangGraph-链式处理（一）

DeepSeek R1：中国AI黑马的崛起与挑战

构建桌面聊天助手：Mistral AI、LangChain 和 Tkinter 的结合

大语言模型应用指南：OpenAI大语言模型简介

大语言模型原理基础与前沿高效的MoE架构