LLMs 第2页

【大模型】【DeepSeek】DeepSeek-R1：Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

DeepSeek-R1：通过强化学习激励大语言模型的推理能力0.论文摘要我们推出了第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练而成的模型，没有经过监督微调（SFT）作为初步步骤，展现了卓越的推理能力。通过RL，DeepSeek-R1-Zero自然涌现出许多强大且有趣的推理行为。然而，它也面临诸如可读性差

量子-Alex·2025-06-08 18:51

LLM2Vec：开启大型语言模型的文本编码新纪元

LLM2Vec：开启大型语言模型的文本编码新纪元项目地址:https://gitcode.com/gh_mirrors/ll/llm2vec在当今的AI领域，如何高效利用大型语言模型（LLMs）进行文本表示

殷巧或·2025-06-08 06:25

LLM基础1_语言模型如何处理文本

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn工具介绍tiktoken：OpenAI开发的专业"分词器"torch：Facebook

激进小猪1002·2025-06-08 05:54

LLM基础2_语言模型如何文本编码

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn字节对编码(BPE)上一篇博文说到为什么GPT模型不需要[PAD]和[UNK

激进小猪1002·2025-06-08 05:53

Model Context Protocol (MCP) 介绍

ModelContextProtocol(MCP)介绍概述ModelContextProtocol(MCP)是一个开放协议，用于标准化应用程序如何为大型语言模型（LLMs）提供上下文。

未来创世纪·2025-06-08 03:38

【AI】大语言模型引擎全解析：Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama，最佳选择？

近年来，大语言模型（LLMs）如GPT、LLaMA、BERT等已经成为人工智能领域的核心驱动力。然而，如何高效地运行和优化这些模型，成为了开发者和研究者面临的重要挑战。

厦门德仔·2025-06-07 12:02

unsloth微调Qwen3模型实战

一、前言Unsloth是一个专注于优化大型语言模型（LLMs）微调效率的开源框架，旨在显著提升训练速度并降低显存占用，使得在资源有限的硬件（如单张消费级GPU）上高效微调大模型成为可能。

韭菜盖饭·2025-06-06 22:19

本地部署AI大模型应用私有化部署deepseek本地部署与应用解决方案

随着人工智能技术的飞速发展，大模型（LLMs）已成为推动企业数字化转型的核心动力，而数据作为企业的重要资产，其价值的挖掘离不开大模型的强大赋能。

公众号：数据化运营圈·2025-06-06 10:02

LoRA：大模型高效微调的低秩之道——原理解析与技术实现

LoRA：大模型高效微调的低秩之道——原理解析与技术实现大型语言模型（LLMs）的全参数微调如同驾驶油轮转弯——资源消耗巨大且响应迟缓。

摘取一颗天上星️·2025-06-05 22:43

【学习笔记6】论文SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy

随着GPT-3.5和GPT-4等大型语言模型（LLMs）的兴起，这一领域得到了极大的推动，提供了更好的自然语言理解能力和生成细致入微的SQL语句的能力。

||Φ|(|T|Д|T|)|Φ||/·2025-06-05 07:59

jony0917·2025-06-05 05:41

你真的会用AI吗？浅谈输出格式对大语言模型推理能力的影响

今天，我们将深入探讨一个引人注目的AI研究发现：输出格式如何影响大语言模型（LLMs）的推理能力。这个话题不仅关乎AI技术的发展，更直接影响到我们如何更好地利用这些强大的工具。

蒜鸭·2025-06-04 04:23

腾讯混元2025CVPR论文全解读：6篇论文速通大模型前沿

ExploringLong-ChainVisualReasoningwithMultimodalLargeLanguageModels（Insight-V:大语言模型中的长思维链视觉推理探索）大语言模型（LLMs

zhangjiaofa·2025-06-03 05:40

多模态Agent AI（MAA）系统

这类系统结合了大型语言模型（LLMs）和视觉语言模型（VLMs），以增强其在物理或虚拟世界中的感知和生成能力。MAA系统的研究领域广泛，包括游戏（VR/AR/MR）、机器人技术和医疗保健等。

百态老人·2025-06-02 23:31

m0_46521579·2025-06-01 06:03

大模型核心技术及架构解析

大模型核心技术及架构解析大语言模型(LargeLanguageModels,LLMs)已成为当前AI领域最重要的技术突破之一。

阿湯哥·2025-06-01 05:28

关于大语言模型的问答？

1.Whyisprompt（提示词）engineeringnecessarywhenworkingwithlargelanguagemodels(LLMs)?

白光白光·2025-06-01 00:29

构建有状态的多智能体应用：深入解析 Python 的 LangGraph 库

一、引言随着大型语言模型（LLMs）的快速发展，构建复杂的AI应用程序变得越来越可行。然而，如何有效地管理多个智能体之间的交互、状态和工作流程，仍然是一个挑战。

萧鼎·2025-05-31 09:36

LangChain4J Spring Boot 集成 LLMs

LangChain4JSpringBoot集成LLMsLangChain4j提供了用于以下目的的SpringBoot启动器：流行的集成声明式AIServicesSpringBoot启动器SpringBoot启动器帮助通过属性创建和配置语言模型、嵌入模型、嵌入存储以及其他核心LangChain4j组件。要使用其中一个SpringBoot启动器，请导入相应的依赖项。SpringBoot启动器依赖项的命

Five_B·2025-05-31 03:51

论文翻译：Automatic Lesson Plan Generation via Large Language Models with Self-critique Prompting

AutomaticLessonPlanGenerationviaLargeLanguageModelswithSelf-critiquePromptinghttps://link.springer.com/chapter/10.1007/978-3-031-64315-6_13通过自我批评提示的大型语言模型自动生成课程计划摘要在本文中，我们利用大型语言模型（LLMs

CSPhD-winston-杨帆·2025-05-30 18:17

Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information

一、文章主要内容总结本文聚焦于评估大型语言模型（LLMs）对英国政府公共卫生信息的掌握情况，核心内容如下：背景与目标随着LLMs的普及，其在公共卫生领域的信息准确性至关重要，但目前缺乏针对英国政府公共卫生指南的评估

UnknownBody·2025-05-30 09:42

Large-Scale Language Models: In-Depth Principles and Pioneering Innovations

大规模语言模型（Large-ScaleLanguageModels,LLMs）是人工智能领域的璀璨明珠，深刻重塑了自然语言处理（NLP）并推动多模态应用的蓬勃发展。

Kelaru·2025-05-28 06:33

SpringBoot LangChain4j 集成deepseek大模型

一、LangChain4j介绍LangChain4j是一个给大语言模型（LLMs）用的Java开发框架。它诞生在2023年初ChatGPT掀起的大模型热潮里。

奋斗的狍子007·2025-05-27 23:07

AI“高情商”奥秘，LLM多轮情感对话新突破！

然而，当前的大语言模型（LLMs）在处理这类对话时，往往侧重于单轮回复的即时效果，缺乏对多轮对话的长期

Python_金钱豹·2025-05-25 06:23

多样本上下文学习：开拓大模型的新领域

大模型（LLMs）在少量样本上下文学习（ICL）中展现出了卓越的能力，即通过在推理过程中提供少量输入输出示例来学习，而无需更新权重。

人工智能大模型讲师培训咨询叶梓·2025-05-25 01:55

AI与.NET技术实操系列（七）：使用Emgu CV进行计算机视觉操作

技术实操系列(9)1.AI与.NET技术实操系列（一）：开篇03-032.AI与.NET技术实操系列（二）：开始使用ML.NET03-043.AI与.NET技术实操系列（三）：在.NET中使用大语言模型（LLMs

八小一·2025-05-24 23:11

谷歌medgemma-27b-text-it医疗大模型论文速读：多语言大型语言模型医学问答基准测试MedExpQA

《MedExpQA:多语言大型语言模型医学问答基准测试》论文解析一、引言论文开篇指出大型语言模型（LLMs）在医学领域的巨大潜力，尤其是在医学问答（QA）方面。

Open-source-AI·2025-05-24 03:21

大语言模型 vs NLTK/SpaCy：NLP工具的代际跃迁与互补之道

大语言模型vsNLTK/SpaCy：NLP工具的代际跃迁与互补之道技术代际差异：从「工具包」到「智能体」的进化如果说NLTK和SpaCy是「文本处理的瑞士军刀」，那么大语言模型（LLMs）就是「会思考的

赛卡·2025-05-24 02:48

张 12种心理咨询主题与治疗方式

数字孪生心理咨询师框架（PsyDT）：1.数字孪生心理咨询师框架（PsyDT）核心目标：利用大语言模型（LLMs）构建具有个性化咨询风格的心理咨询师数字孪生，解决现有心理健康LLMs忽视咨询师个体风格差异的问题

ZhangJiQun&MXP·2025-05-23 13:44

基于Llamaindex的本地向量与大模型RAG搭建流程

工程化必须解决的全本地路径：本地embedding和LLMs（如Ollama）。Qwen指导文档给出了基于HF或者其他使用APIKey大模型的示例，场景不符。

1024点线面·2025-05-23 03:10

【AI论文】PRIMA.CPP：在低资源日常家用集群上加速700亿参数级大型语言模型推理

摘要：DeepSeekR1和QwQ32B的出现突破了在家用设备上运行前沿大型语言模型（LLMs）的性能障碍。

东临碣石82·2025-05-22 04:15

幻觉的迷宫：DeCo算法与大型语言模型的真相之旅

无论是多模态大型语言模型（MLLMs），还是单模态的LLMs，这一问题都如影随形。尤其在医疗、法律等高风险领域，幻觉不仅仅是“说错话”那么简单，甚至可能引发灾难性的后果。

步子哥·2025-05-21 15:45

如何用好“对话式编程”？牢记这十二条策略

编者按：如何有效利用大语言模型（LLMs）生成高质量代码？这是当下开发者们比较关心的一个问题。在生成代码的过程中，提示词的设计是否精确，直接决定了模型输出的质量。

·2025-05-21 11:47

Ai学习之LangChain框架

一、什么是LangChainLangChain是一个用于开发由大型语言模型（LLMs）驱动的应用程序的开源框架。

MClink·2025-05-21 08:28

一文搞懂DeepSeek - DeepSeek-R1-Zero和DeepSeek-R1

DeepSeek推出了第一代推理模型——DeepSeek-R1-Zero和DeepSeek-R1，通过强化学习激励大型语言模型（LLMs）的推理能力。1、什么是DeepSeek-R1?

大模型本地部署·2025-05-20 12:27

一文看懂：多模态大模型（LMMs）与大语言模型（LLMs）的比较

大家好，我是大F，深耕AI算法十余年，互联网大厂技术岗。知行合一，不写水文，喜欢可关注，分享AI算法干货、技术心得。更多文章见《大模型理论和实战》、《DeepSeek技术解析和实战》，一起探索技术的无限可能！【数据集篇】更多阅读：大语言模型常见任务及评测数据集汇总（一）：70余个数据集!https://blog.csdn.net/zengzizi/article/details/137251140

大F的智能小课·2025-05-20 08:33

论文翻译：ACL-2024.Yiming Huang.Competition-Level Problems are Effective LLM Evaluators

aclanthology.org/2024.findings-acl.803.pdf《竞赛级问题作为有效的LLM评估者》文章目录《竞赛级问题作为有效的LLM评估者》摘要1引言6结论局限性摘要大型语言模型（LLMs

CSPhD-winston-杨帆·2025-05-20 03:57

大语言模型应用指南：大语言模型的安全技术

大语言模型的安全技术作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着大语言模型（LargeLanguageModels,LLMs

AI天才研究院·2025-05-20 02:20

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-25

2024-09-251.PromSec:PromptOptimizationforSecureGenerationofFunctionalSourceCodewithLargeLanguageModels(LLMs

sp_fyf_2024·2025-05-19 22:19

LlamaIndex 第七篇结构化数据提取

大型语言模型（LLMs）在数据理解方面表现出色，这也促成了它们最重要的应用场景之一：能够将常规的人类语言（我们称之为非结构化数据）转化为特定的、规范的、可被计算机程序处理的格式。

王学政2·2025-05-19 01:03

LlamaIndex第二篇使用LLMs和Embeddings向量模型

LlamaIndex为各类大语言模型（LLM）提供了统一接口，使用起来非常简单——只需安装对应的集成包即可： pipinstallllama-index-llms-openai-ihttps://mirrors.aliyun.com

王学政2·2025-05-19 01:32

英伟达推理模型论文速读：OpenCodeReasoning-Nemotron-32B

OpenCodeReasoning:AdvancingDataDistillationforCompetitiveCoding1.研究背景与动机自基于推理的大型语言模型（LLMs）出现以来，在代码任务中将推理能力蒸馏到学生模型中的技术取得了显著进展

Open-source-AI·2025-05-18 19:47

源2.0-M32大模型适配AutoGPTQ工具及量化&推理教程

AutoGTPQ简介AutoGPTQ‌是一个开源工具包，专注于简化大规模语言模型(LLMs)的量化过程。

源大模型·2025-05-18 09:11

A Survey on Multimodal Large Language Models论文解读

MultimodalLargeLanguageModel(MLLM)representedbyGPT-4Vhasbeenanewrisingresearchhotspot,whichusespowerfulLargeLanguageModels(LLMs

call me by ur name·2025-05-18 06:43

论文阅读：A Survey on Evaluation of Large Language Models

ASurveyonEvaluationofLargeLanguageModels这篇论文是由YupengChang等人撰写的关于大型语言模型（LLMs）评估的综述，题为《ASurveyonEvaluationofLargeLanguageModels

CSPhD-winston-杨帆·2025-05-18 05:10

给MCP加上RAG，工具准确率提升200%，起飞～

Datawhale分享作者：TiantianGan、QiyaoSun编辑：PaperAgent大型语言模型（LLMs）在有效利用越来越多的外部工具（如模型上下文协议（MCP）所定义的工具）方面存在困难，

Datawhale·2025-05-18 00:39

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

主要内容研究背景：强化学习（RL）虽能提升大语言模型（LLMs）文本推理能力，但在数值计算和符号操作任务中仍存在局限，计算工具如代码解释器（CI）可弥补这一不足。

UnknownBody·2025-05-15 10:43

思维链（Chain-of-Thought, CoT）

大语言模型（LLMs）在复杂推理任务（如数学、逻辑、常识推理）中，单步输出答案的准确性有限。

爱看烟花的码农·2025-05-14 01:34

尤雨溪宣布：Vue 生态正式引入 AI

尤雨溪近日宣布，Vue、Vite和Rolldown的文档网站均已添加了llms.txt文件，这一举措旨在让大型语言模型（LLM）更方便地理解这些前端技术。

xiangzhihong8·2025-05-13 22:41

大语言模型应用指南：Prompt高效微调

Prompt高效微调关键词：大语言模型,Prompt,微调,参数高效,自然语言处理(NLP),对话系统,知识图谱,数据增强1.背景介绍1.1问题由来近年来，大语言模型（LargeLanguageModels,LLMs

AI大模型应用实战·2025-05-13 16:36

推荐频道

LLMs