llms 第7页

Title: Empowering Social Network Intelligence with AI Agents

AIagents,poweredbyadvancementsinlargelanguagemodels(LLMs)andmultimodalAItechnologies,arerevolutionizingsocialnetworksbyofferingdeeperinsightsintouserinteractions

诗远小一·2025-02-26 14:28

Lil‘Log《Extrinsic Hallucinations in LLMs》读后总结

博客《ExtrinsicHallucinationsinLLMs》由LilianWeng撰写，详细探讨了大型语言模型（LLMs）中“幻觉”现象的背景、原因、类型、影响及其缓解策略。

心碎小猫p·2025-02-25 02:42

docker安装Open WebUI详解-遇到的坑OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file

一、OpenWebUI简介OpenWebUI（https://openwebui.com）是一个用户友好的Web界面，专为本地大语言模型（LLMs）设计。

坚定信念，勇往无前·2025-02-24 22:16

能力模型迁移：专业教育从「知识掌握度」转向「提示工程能力」

然而，随着以大型语言模型（LLMs）为代表的生成式AI技术的崛起，仅仅掌握知识已经远远不够，提示工程能力逐渐成为更核心、更关键

由数入道·2025-02-24 20:05

DeepSeek-R1秘籍轻松迁移，只需原始数据0.3% | 邱锡鹏团队联合出品

他们提出了MHA2MLA这种数据高效的微调方法，使基于MHA（多头注意力）的大语言模型（LLMs）能够顺利转换到MLA架构。以Llama2-7B为例

·2025-02-24 19:13

对抗性提示（adversarial prompts）

对抗性提示对抗性提示是提示工程中的一个重要主题，它可以帮助我们了解LLMs所涉及的风险和安全问题。对抗性提示也是一个重要的学科，可以识别这些风险并设计技术来解决这些问题。

u013250861·2025-02-23 16:18

Grok-3：人工智能领域的新突破

大模型之路·2025-02-23 10:59

LLM之提示词工程

掌握提示工程技能对于深入理解大型语言模型（LLMs）的潜力与局限至关重要。研究人员借助提示工程，致力于增强LLM在广泛且复杂的任务（如问答系统与算术推理）中的表现。

樱花的浪漫·2025-02-22 16:11

2023-arXiv-FinGPT: 开源金融大语言模型

https://github.com/AI4Finance-Foundation/FinGPT&https://github.com/AI4Finance-Foundation/FinNLP摘要：大语言模型（LLMs

量仔搞靓化·2025-02-22 12:41

AnythingLLM 项目安装与配置指南

AnythingLLM项目安装与配置指南anything-llm为开源和闭源的大型语言模型（LLMs）、嵌入器和向量数据库提供开源的ChatGPT体验。

龙聪山Diane·2025-02-20 02:04

Ollama部署大模型并安装WebUi

Ollama用于在本地运行和部署大型语言模型（LLMs）的工具，可以非常方便的部署本地大模型安装Linuxcurl-fsSLhttps://ollama.com/install.sh|sh我是ubuntu

m0_74823611·2025-02-20 01:29

[论文笔记] Cost-Effective Hyperparameter Optimization for Large Language Model Generation 大型语言模型生成推理超参优化

id=DoGmh8A39OChiWang1,SusanXueqingLiu2,AhmedH.Awadallah11微软研究院，雷德蒙德2史蒂文斯理工学院摘要大型语言模型（LLMs）因其生成能力引发了广泛关注

心心喵·2025-02-19 02:45

大语言模型（LLM）如何实现上下文的长期记忆？

引言大语言模型（LargeLanguageModels,LLMs），如GPT-4、Claude和LLaMA等，已经在自然语言处理领域展现出卓越的能力。

·2025-02-18 00:06

使用多模态大语言模型进行深度学习的图像、文本和语音数据增强

在过去的五年里，研究方向已从传统的机器学习（ML）和深度学习（DL）方法转向利用大语言模型（LLMs），包括多模态方法，用于数据增强，以提高泛化能力，并在训练深度卷积神经网络时防止过拟合。

数行天下·2025-02-17 12:42

深度剖析DeepSeek本地部署：技术、实践与优化策略

其中，大语言模型（LLMs）作为人工智能领域的关键技术，在自然语言处理、智能客服、内容创作等众多领域展现出了强大的应用潜力，引发了学术界和产业界的广泛关注。

Abossss·2025-02-17 05:11

大模型会替代哪些工作岗位?

引言本文主要探讨了大模型（LLMs）对就业市场的影响。包括了介绍那些已经受到大模型影响的行业，对大模型将要产生的影响，以及如何更好的监管大模型应用进行了讨论。

中年猿人·2025-02-15 12:30

【deepseek】论文笔记--DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

DeepSeek-R1论文解析1.论文基本信息标题：DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning作者：DeepSeek-AI团队（联系邮箱：[email protected]）发表时间与出处：2024年，AIME2024（人工智能与数学教育国际会议）关键词：ReinforcementLe

大表哥汽车人·2025-02-15 02:40

大语言模型原理基础与前沿通过稀疏MoE扩展视觉语言模型

大语言模型（LargeLanguageModels,LLMs）如GPT-3、BERT等，已经在自然语言处理（NLP）任务中取得了显著的成果。

AI天才研究院·2025-02-14 12:52

【AI论文】使用大型推理模型进行竞技编程

摘要：我们的研究表明，将强化学习应用于大型语言模型（LLMs）能显著提升复杂编码和推理任务的性能。

东临碣石82·2025-02-13 23:06

多模态大模型（LMMs）与大语言模型（LLMs）的比较

前言现在的大模型分为两大类：大语言模型（LargeLanguageModels，简称LLMs）和多模态大模型（LargeMultimodalModels，简称LMMs）。

大F的智能小课·2025-02-13 23:02

如何训练LLMs进行“思考”（如o1和DeepSeek-R1）

如何训练LLMs进行“思考”（如o1和DeepSeek-R1）阅读时长：19分钟发布时间：2025-02-13近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM

·2025-02-13 16:07

使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型

在这篇技术文章中，我们将探讨如何使用llama-cpp-python（llama.cpp的Python绑定）在本地运行大语言模型（LLMs）。

hgSdaegva·2025-02-12 20:16

llama3简介与国内最快体验方式

Meta公司研发并推出了MetaLlama3系列大型语言模型（LLMs），该系列包括8B和70B参数量的预训练及指令调优生成文本模型。

weixin_40941102·2025-02-12 15:08

Java程序员Python一小时速成

背景由于最近要开发一些AILLM（LargeLanguageModel大语言模型）应用程序，然后又想使用LangChain（LangChain是一个用于构建和操作大语言模型（LLMs）的框架，旨在帮助开发者更方便地集成和使用各种

BossFriday·2025-02-12 15:04

大语言模型多代理协作（MACNET）

研究背景与动机：大语言模型（LLMs）因神经缩放定律展现出强大能力，

ZhangJiQun&MXP·2025-02-12 00:51

【NLP算法面经】NLP算法面经 -- 腾讯 VS 美团（附面题）

博客主页：[青松]目录【NLP百面百过】大模型算法高频面题（全面整理ʘ‿ʘ）一、大模型（LLMs）基础面大模型（LLMs）架构篇注意力机制（Attention）篇Transformer理论篇二、大模型微调面有监督微调

青松ᵃⁱ·2025-02-11 13:37

《大语言模型：原理与工程实践》书籍推荐及详细说明

随着人工智能技术的发展，尤其是深度学习技术的进步，大规模语言模型（LargeLanguageModels,LLMs）已成为自然语言处理领域的研究热点。

大模型入门教程·2025-02-11 01:57

代码星辰：探索 benchmark 构建的奥秘之旅

而在这片“代码星海”中，如何评估大语言模型（LLMs）在编程任务上的表现，就像天文学家借助望远镜探索宇宙奥秘一般关键。近日，一篇题为《HowShouldIBuildABenchmark?

步子哥·2025-02-10 07:56

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域，大型语言模型（LLMs）的应用越来越广泛。

qq_37836323·2025-02-10 01:37

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读

文章目录前言一、摘要二、引言三、贡献1.贡献后训练：基础模型的大规模强化学习蒸馏：较小的模型也可以很强大2.评估结果概览reasoningtasksknowledgeohters四、方法1.Overview2.DeepSeek-R1-Zero:ReinforcementLearningontheBaseModelReinforcementLearningAlgorithm(GRPO重点)Rewar

tangjunjun-owen·2025-02-09 23:54

大模型 RAG 知识总结

RAG（Retrieval-AugmentedGeneration）面一、LLMs已经具备了较强能力了，存在哪些不足点？

da pai ge·2025-02-09 16:38

DeLLMa框架：优化复杂决策的新路径

标题：DeLLMa框架：优化复杂决策的新路径文章信息摘要：DeLLMa框架通过整合大型语言模型（LLMs）和结构化数据，优化了在不确定性条件下的决策过程，特别是在处理复杂决策问题时，能够增强决策的严谨性和精确性

XianxinMao·2025-02-09 16:07

蒸馏：让DeepSeek用“移魂大法”增强你的小模型

蒸馏：让DeepSeek用“移魂大法”增强你的小模型原创格知致能寒武纪人工智能2025年02月06日00:48北京前言在大型语言模型（LLMs）时代，知识蒸馏成为一种重要方法，用于将能力强大的、参数规模庞大的

AI生成曾小健·2025-02-09 11:58

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

这是深入了解大型语言模型LLMs如何训练的绝佳机会。

大模型之路·2025-02-08 20:03

【Ollama+Deepseek】本地化部署运行Deepseek模型

二、Ollama下载安装Ollama是一个开源工具，用于在本地计算机上快速部署和运行大型语言模型（LLMs）。它专注于简化LLM的本地运行流程，无需复杂的配置即可在个人设备（如

·2025-02-08 06:32

AI大语言模型的全面解读

大语言模型（LargeLanguageModels,LLMs）无疑是近年来最耀眼的星辰之一。

草莓屁屁我不吃·2025-02-08 05:48

【Ollama+Deepseek】本地化部署运行Deepseek模型

二、Ollama下载安装Ollama是一个开源工具，用于在本地计算机上快速部署和运行大型语言模型（LLMs）。它专注于简化LLM的本地运行流程，无需复杂的配置即可在个人设备（如

·2025-02-08 02:59

【论文阅读】DeepSeek-R1：通过强化学习激励LLMs的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL

DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearningDeepSeek-R1：通过强化学习激励LLMs的推理能力

AI天才研究院·2025-02-07 22:05

大语言模型原理基础与前沿高效的MoE架构

大语言模型原理基础与前沿高效的MoE架构关键词：大语言模型，MoE架构，参数高效微调，分布式训练，模型压缩，推理加速1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大语言模型（LargeLanguageModels，LLMs

AI架构设计之禅·2025-02-07 13:39

LLM速览篇【91-120】

hjzhang75·2025-02-07 13:03

产品经理的人工智能课 02 - 自然语言处理

2一个NLP算法的例子——n-gram模型3预处理与重要概念3.1分词Token3.2词向量化表示与Word2Vec4与大语言模型的交互过程参考链接大语言模型（LargeLanguageModels,LLMs

平头某·2025-02-07 05:12

专为RAG和AGENT而生的PDF解析新工具：PymuPDF4LLM

为此，就出现了一个专为大语言模型（LLMs，LargeLanguageModels）设计的PDF解析的大杀器：PymuPDF4llm。

CS创新实验室·2025-02-07 03:56

Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM

论文信息标题：UnifyingLargeLanguageModelsandKnowledgeGraphs:ARoadmap作者：ShiruiPan摘要LLMs，例如chatGPT和GPT4，由于其涌现能力和泛化性

笨cc·2025-02-06 22:23

[论文笔记] Deepseek技术报告

1.总体概述背景与目标报告聚焦于利用强化学习（RL）提升大型语言模型（LLMs）的推理能力，旨在探索在不依赖大规模监督微调（SFT）的情况下，模型如何自我进化并形成强大的推理能力。

心心喵·2025-02-06 22:53

Python用langchain、OpenAI大语言模型LLM情感分析AAPL股票新闻数据及提示工程优化应用

p=39614本文主要探讨了如何利用大语言模型（LLMs）进行股票分析。

·2025-02-06 17:10

大模型面试必看！超详细面经指南+答案，轻松拿Offer！2025大模型上岸就靠它了！

目录[x]大模型（LLMs）基础面[x]1.目前主流的开源模型体系有哪些？[x]2.prefixLM和causalLM区别是什么？[x]3.涌现能力是啥原因？[x]4.大模型LLM的架构介绍？

AI大模型-大飞·2025-02-06 16:47

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索在人工智能领域，大型语言模型（LLMs）的发展日新月异，其在自然语言处理和生成任务中的表现逐渐接近人类水平。

kaichu2·2025-02-06 03:07

什么是大模型框架？常用的大模型框架盘点对比

什么是大模型框架大模型框架是指用于训练、推理和部署大型语言模型（LLMs）的软件工具和库。

AI产品经理·2025-02-05 21:25

关于大模型 AGI 应知应会＿生在AI发展的时代

一、大模型的核心概念与特点（一）什么是大模型大模型（LargeLanguageModels，LLMs）是指具有大规模参数和复杂计算结构的深度学习模型，通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数

森焱森·2025-02-05 10:38

【memgpt】letta 课程1/2：从头实现一个自我编辑、记忆和多步骤推理的代理

llms-as-operating-systems-agent-memoryllms-as-operating-systems-agent-memory内存操作系统的内存管理

等风来不如迎风去·2025-02-03 23:06

推荐频道

llms

Title: Empowering Social Network Intelligence with AI Agents

Lil‘Log《Extrinsic Hallucinations in LLMs》读后总结

docker安装Open WebUI详解-遇到的坑OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file

能力模型迁移：专业教育从「知识掌握度」转向「提示工程能力」

DeepSeek-R1秘籍轻松迁移，只需原始数据0.3% | 邱锡鹏团队联合出品

对抗性提示（adversarial prompts）

Grok-3：人工智能领域的新突破

LLM之提示词工程

2023-arXiv-FinGPT: 开源金融大语言模型

AnythingLLM 项目安装与配置指南

Ollama部署大模型并安装WebUi

[论文笔记] Cost-Effective Hyperparameter Optimization for Large Language Model Generation 大型语言模型生成推理超参优化

大语言模型（LLM）如何实现上下文的长期记忆？

使用多模态大语言模型进行深度学习的图像、文本和语音数据增强

深度剖析DeepSeek本地部署：技术、实践与优化策略

大模型会替代哪些工作岗位?

【deepseek】论文笔记--DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

大语言模型原理基础与前沿 通过稀疏MoE扩展视觉语言模型

【AI论文】使用大型推理模型进行竞技编程

多模态大模型（LMMs）与大语言模型（LLMs）的比较

如何训练LLMs进行“思考”（如o1和DeepSeek-R1）

使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型

llama3简介与国内最快体验方式

Java程序员Python一小时速成

大语言模型多代理协作（MACNET）

【NLP算法面经】NLP算法面经 -- 腾讯 VS 美团（附面题）

《大语言模型：原理与工程实践》书籍推荐及详细说明

代码星辰：探索 benchmark 构建的奥秘之旅

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读

大模型 RAG 知识总结

DeLLMa框架：优化复杂决策的新路径

蒸馏：让DeepSeek用“移魂大法”增强你的小模型

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

【Ollama+Deepseek】本地化部署运行Deepseek模型

AI大语言模型的全面解读

【Ollama+Deepseek】本地化部署运行Deepseek模型

【论文阅读】DeepSeek-R1：通过强化学习激励LLMs的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL

大语言模型原理基础与前沿 高效的MoE架构

LLM速览篇【91-120】

产品经理的人工智能课 02 - 自然语言处理

专为RAG和AGENT而生的PDF解析新工具：PymuPDF4LLM

Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM

[论文笔记] Deepseek技术报告

Python用langchain、OpenAI大语言模型LLM情感分析AAPL股票新闻数据及提示工程优化应用

大模型面试必看！超详细面经指南+答案，轻松拿Offer！2025大模型上岸就靠它了！

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索

什么是大模型框架？常用的大模型框架盘点对比

关于大模型 AGI 应知应会＿生在AI发展的时代

【memgpt】letta 课程1/2：从头实现一个自我编辑、记忆和多步骤推理的代理

大语言模型原理基础与前沿通过稀疏MoE扩展视觉语言模型

大语言模型原理基础与前沿高效的MoE架构