闻达语言模型第14页

Decoder-Only、Encoder-Only、Encoder-Decoder 区别

应用：通常用于生成任务，如语言模型和对话系统。代表模型：GPT（GenerativePre-trainedTransformer）特点：自回归生成：模型通过

会喘气的粽子丶·2025-02-18 18:44

【带你 langchain 双排系列教程】1. langchian 基本架构与环境配置（siliconFlow Deepseek接入）

LangChain是一个用于构建和部署大模型应用的框架，涵盖了从语言模型（LLM）到检索增强生成（RAG）、OpenAI集成以及智能体（Agent）的全套工具链。

夜里慢慢行456·2025-02-18 17:35

使用OpenAI LLM与Neo4j数据库进行自然语言交互

本篇文章将介绍如何使用OpenAI的语言模型将自然语言问题转换成Cypher查询，并通过Neo4j数据库执行该查询，并给出自然语言的响应。

bBADAS·2025-02-18 16:53

LLM 参数解析：使用 OpenAI API 在 Python 中的实用指南（含示例）

当你使用大语言模型（LLM）时，可能会注意到，即使提交相同的请求，多次运行后仍然会得到不同的回应。这是因为LLM具有概率性，它们的输出基于所学到的模式和概率，而不是固定规则。

真智AI·2025-02-18 14:09

Windows Docker Desktop部署MaxKB详细教程

MaxKB（MaxKnowledgeBase）是一款基于大语言模型（LLM）和检索增强生成（RAG）技术的开源知识库问答系统，旨在帮助企业、教育机构及研究组织高效管理知识并提供智能问答服务。

Roc-xb·2025-02-18 13:28

AI 编程工具崛起，程序员的未来是否岌岌可危？

再者，深度学习技术的突破，尤其是大语言模型在代码理解与生成方面的显著进展，为AI编程提供了坚实的技术基础。最后，随着软件开发需求的不断增加，传统开发

·2025-02-18 13:26

【目标检测】多模态航空目标检测：A SIMPLE AERIAL DETECTION BASELINE OF MULTIMODAL LANGUAGE MODELS

阅读并理解一篇论文：ASIMPLEAERIALDETECTIONBASELINEOFMULTIMODALLANGUAGEMODELS该文首次提出了一种将多模态语言模型应用于航空检测的简单基线方法，名为LMMRotate

慕容紫英问情·2025-02-18 12:46

《DeepSeek训练算法：开启高效学习的新大门》

在人工智能的浪潮中，大语言模型的发展日新月异。DeepSeek作为其中的佼佼者，凭借其独特的训练算法和高效的学习能力，吸引了众多目光。

·2025-02-18 04:41

使用Python中的LangChain库优化消息长度：从聊天历史到模型性能的全面指南

使用Python中的LangChain库优化消息长度：从聊天历史到模型性能的全面指南在现代人工智能应用中，大语言模型（LLM）扮演着越来越重要的角色，尤其是在对话系统、智能助理和其他自然语言处理任务中。

m0_57781768·2025-02-18 03:10

【LLM】大模型基础--大规模预训练语言模型的开源教程笔记

1.引言本文以DataWhale大模型开源教程为学习路线，进行一整个大模型的入门操作什么是语言模型语言模型是一种对词元序列（token）的概率分布，可以用于评估文本序列的合理性并生成新的文本。

Langchain·2025-02-18 02:00

大语言模型（LLM）如何实现上下文的长期记忆？

引言大语言模型（LargeLanguageModels,LLMs），如GPT-4、Claude和LLaMA等，已经在自然语言处理领域展现出卓越的能力。

·2025-02-18 00:06

DeepSeek与ChatGPT：AI语言模型的全面对决

DeepSeek与ChatGPT：AI语言模型的全面对决引言：AI语言模型的时代浪潮一、认识DeepSeek与ChatGPT（一）DeepSeek：国产新星的崛起（二）ChatGPT：AI界的开拓者二、

四念处茫茫·2025-02-17 23:21

DeepSeek的崛起之路：从技术突破到行业变革

一、DeepSeek的进化历程初创与奠基（2023-2024）作为幻方量化子公司，DeepSeek于2023年在杭州成立，专注于大语言模型研发。

诚信爱国敬业友善·2025-02-17 18:05

边缘AI架构提升LLM应用的响应速度

边缘AI架构提升LLM应用的响应速度关键词边缘计算、边缘AI、LLM、响应速度、模型压缩、分布式计算摘要本文探讨了如何通过边缘AI架构提升大型语言模型（LLM）应用的响应速度。

AI天才研究院·2025-02-17 15:08

如何在不依赖函数调用功能的情况下结合工具与大型语言模型

当大型语言模型（LLM）原生不支持函数调用功能时，如何实现智能工具调度？本文通过自然语言解析+结构化输出控制的方法来实现。

Jason9510·2025-02-17 15:01

DeepSeek 混合专家（MoE）架构技术原理剖析

DeepSeek混合专家（MoE）架构技术原理剖析在人工智能快速发展的当下，大规模语言模型不断突破创新，DeepSeek混合专家（MoE）架构脱颖而出，成为业内关注焦点。

计算机学长·2025-02-17 13:15

使用多模态大语言模型进行深度学习的图像、文本和语音数据增强

在过去的五年里，研究方向已从传统的机器学习（ML）和深度学习（DL）方法转向利用大语言模型（LLMs），包括多模态方法，用于数据增强，以提高泛化能力，并在训练深度卷积神经网络时防止过拟合。

数行天下·2025-02-17 12:42

本地部署 DeepSeek：环境准备 + 详细步骤 + 高级部署方案 + 可视化工具集成 + 故障排除手册 + 性能优化建议

前言随着人工智能技术的迅猛发展，大语言模型（LLM）在多个行业中的应用日益广泛，从自然语言处理、内容生成到智能客服、医疗诊断等领域，AI正在深刻改变传统的工作方式和业务流程。

Katie。·2025-02-17 12:08

基于DeepSeek-R1的高效推理优化实战：从API封装到动态批处理

引言在LLM（大语言模型）应用中，推理延迟和计算资源消耗是核心痛点。

竹木有心·2025-02-17 11:29

深度剖析DeepSeek本地部署：技术、实践与优化策略

其中，大语言模型（LLMs）作为人工智能领域的关键技术，在自然语言处理、智能客服、内容创作等众多领域展现出了强大的应用潜力，引发了学术界和产业界的广泛关注。

Abossss·2025-02-17 05:11

DeepSeek R1 与 OpenAI O1：机器学习模型的巅峰对决

点赞收藏❤一、引言在机器学习的广袤天地中，大型语言模型（LLM）无疑是最为璀璨的明珠。它们凭借卓越的语言理解与生成能力，正以前所未有的方式重塑着我们与信息交互的模式。

学无止尽5·2025-02-17 04:59

Python自学攻略：AI时代的高效学习法 —— 如何用大模型快速上手编程

借助大语言模型（如Deepseek、GPT、Claude、Kimi、豆包等），学习效率可以提升数倍。本文将结合实操路径、工具链和避坑指南，为你提供一套AI时代的Python速成方案。

优化小秦·2025-02-17 02:19

《AI对话秘籍：5个Prompt Engineering核心技巧让DeepSeek输出质量翻倍》

然而，如何高效地与这些语言模型进行交互，获得准确、相关且高质量的回复，成为了应用中的一个关键挑战。这时，PromptEngineering（提示词工程）便成为了一项必不可少的技能。

Athena-H·2025-02-17 02:44

95%人都不知道的，或许是最全DeepSeek 提示词合集、使用技巧与代码实现全攻略【建议收藏】

一、引言DeepSeek作为一款强大的AI大语言模型工具，凭借其高效、灵活的特点，受到了众多开发者和用户的青睐。

大F的智能小课·2025-02-16 23:26

【vLLM 学习】安装

vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。

·2025-02-16 23:25

基于 LLM 的智能运维 Agent 系统设计与实现

摘要本文详细介绍了一个基于大语言模型(LLM)的智能运维Agent系统的设计与实现。该系统采用多Agent协同的架构，通过事件驱动的方式实现了自动化运维流程。

LLM教程·2025-02-16 22:51

【AI论文】随机鹦鹉在大型语言模型（LLM）之肩：物理概念理解的总结性评估

摘要：我们以系统的方式探讨了一个被广泛提及的问题：大型语言模型（LLM）真的理解它们所说的话吗？这与人们更为熟悉的术语“随机鹦鹉”息息相关。

东临碣石82·2025-02-16 21:16

LLaMA3大模型技术全网最全解析——模型架构与训练方法（收录于GPT-4/ChatGPT技术与产业分析）

chenweiPhD·2025-02-16 21:15

理论一、大模型—概念

大模型全称是大型语言模型（LLM，LargeLanguageModel），这个“大”主要指模型结构容量大，结构中的参数多，用于预训练大模型的数据量大。一个大模型可以

伯牙碎琴·2025-02-16 20:31

Forrester发布2024年五大网络安全新威胁

大选年的叙事（舆论）操控攻击二、深度伪造引发身份安全危机三、生成式人工智能数据泄露四、人工智能软件供应链攻击五、太空成为安全战略高点数据泄露平均成本高达218万美元前言人工智能正重塑网络安全格局，武器化大语言模型正成为首选攻击工具

岛屿旅人·2025-02-16 18:18

DeepSeek正重构具身大模型和人形机器人赛道！

2024年1月20日，公司发布全球首个完全通过强化学习训练的专注于推理任务的高性能语言模型DeepSeek-R1

Robot251·2025-02-16 17:12

大语言模型常用微调与基于SFT微调DeepSeek R1指南

概述大型语言模型（LLM，LargeLanguageModel）的微调（Fine-tuning）是指在一个预训练模型的基础上，使用特定领域或任务的数据对模型进行进一步训练，以使其在该领域或任务上表现更好

知来者逆·2025-02-16 16:08

（15-3）DeepSeek混合专家模型初探：模型微调

3.4模型微调在本项目中，微调脚本文件finetune.py提供了一套全面的工具，用于对DeepSeek-MoE预训练语言模型进行微调。

码农三叔·2025-02-16 16:35

什么是 Ollama？如何安装运行？一文讲清

Ollama是一个可以在本地部署和管理开源大语言模型的框架，由于它极大的简化了开源大语言模型的安装和配置细节，一经推出就广受好评，目前已在github上获得了46kstar。

程序员老冉·2025-02-16 13:16

深入解析LangChain：构建智能应用的全方位指南

包括它的背景、主要功能，以及它在当前语言模型开发中的意义。”你："LangChain是一个开源框架，旨在简化和增强基于语言模型的应用开发。

AIGC大模型吱屋猪·2025-02-16 05:12

AIGC 实战：如何使用 Docker 在 Ollama 上离线运行大模型（LLM）

Ollama简介Ollama是一个开源平台，用于管理和运行各种大型语言模型(LLM)，例如Llama2、Mistral和Tinyllama。它提供命令行界面(CLI)用于安装、模型管理和交互。

surfirst·2025-02-16 04:04

DeepSeek-R1-Zero 与 DeepSeek-R1 的异同与优劣分析

目标均为提升语言模型的复杂推理能力（如数学、代码、科学推理）。基础模型：均以DeepSeek-V3-Base作为初始模型，共享相同的架构

AI生成曾小健·2025-02-16 04:34

大模型参数高效微调（PEFT）技术解析及微调加速实践

2023年，大模型如雨后春笋般爆发，58同城TEG-AILab作为AI平台部门，紧跟大语言模型技术发展步伐，打造了大语言模型平台，支持大语言模型训练和推理部署，并基于大语言模型平台构建了58同城生活服务领域

AI产品经理·2025-02-16 03:53

清华大学KVCache.AI团队联合趋境科技联合的KTransformers开源项目为什么那么厉害

KTransformers是一个由清华大学KVAV.AI团队开发的开源项目，旨在优化大语言模型（LLM）的推理性能，特别是在有限显存资源下运行大型模型。

魔王阿卡纳兹·2025-02-16 03:52

【2025指南】OpenAI API Key 获取攻略：从新手入门到专家级应用，一文掌握！

无论你是开发者、研究人员、内容创作者，还是仅仅对AI充满好奇，OpenAI强大的语言模型都能为你的工作和生活带来无限可能。本指南将手把手教你获取并使用

·2025-02-15 18:21

【python语言应用】最新全流程Python编程、机器学习与深度学习实践技术应用（帮助你快速了解和入门 Python）

赵钰老师·2025-02-15 14:20

本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比

本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比在当今人工智能快速发展的时代，大语言模型（LargeLanguageModel,LLM）的应用场景日益广泛。

MaxCode-1·2025-02-15 12:35

AI-大语言模型

Transformer架构1.简介2.基本原理和结构3.应用场景4.最新进展三、开源1.开源概念2.开源模式3.模型权重四、再谈DeepSeek前言AI‌一、LLMLLM（LargeLanguageModel，大语言模型

真上帝的左手·2025-02-15 12:34

deep seek

1.介绍:DeepSeek是一款由国内人工智能公司研发的大型语言模型，拥有强大的自然语言处理能力，能够理解并回答问题，还能辅助写代码、整理资料和解决复杂的数学问题。

m0_69576880·2025-02-15 12:59

RWKV Runner：让RNN-LLM模型触手可及

在这个信息爆炸的时代，人工智能（AI）已经成为我们生活中不可或缺的一部分，尤其是大语言模型（LLM）在自然语言处理中的广泛应用。

步子哥·2025-02-15 11:57

基于 llama-index与Qwen大模型实现RAG

文章目录llama-index核心功能工作流程Qwen技术特点核心能力RAG核心原理关键优势工作流程知识准备阶段查询处理阶段检索与重排阶段语言模型调用阶段实现环境准备代码实现参考LlamaIndex和Langchain

uncle_ll·2025-02-15 09:35

使用CerebriumAI进行大规模语言模型的推理

使用CerebriumAI进行大规模语言模型的推理技术背景介绍在人工智能的领域中，模型推理的计算资源需求非常高。传统的CPU在处理大规模语言模型（LLM）时效率较低，GPU成为了首选。

qahaj·2025-02-15 07:54

使用SparkLLM实现智能聊天：技术原理与实战演示

技术背景介绍SparkLLM是由iFlyTek提供的一种强大的语言模型，支持多种语言生成任务。它能够理解并生成自然语言，适用于对话系统、内容生成、智能客服等场景。核心原理解析SparkL

shuoac·2025-02-15 06:41

使用vllm docker容器部署大语言模型

说明最近deepseek比较火，我在一台4卡4090的服务器上尝试部署了一下，记录下部署步骤。安装过程安卓docker和nvidia-container-toolkit安装19.03版本以上的docker-ce即可。安装步骤参考清华docker源上的安装步骤：DockerCE软件仓库为了在docker中使用够显卡，需要安卓nvidia-container-toolkit。在线安装请参考英伟达的官方

yuanlulu·2025-02-15 05:33

仅用10张图片，AI就能学会识别万物？多模态小样本学习颠覆传统！

此外，CPE-CLIP和MMFL等方法通过利用预训练模型和冻结的大规模视觉语言模型，实现了跨会话的迁移学习和快速适应新样本。

沃恩智慧·2025-02-15 03:15

推荐频道

闻达语言模型