闻达语言模型第7页

人工智能：从基础到前沿

无监督学习3.4强化学习4.深度学习4.1深度学习概述4.2神经网络基础4.3卷积神经网络（CNN）4.4循环神经网络（RNN）5.自然语言处理（NLP）5.1NLP概述5.2文本预处理5.3词嵌入5.4语言模型

顾漂亮·2025-02-23 12:15

Grok-3：人工智能领域的新突破

大模型之路·2025-02-23 10:59

大语言模型架构：从基础到进阶，如何理解和演变

今天，我们将用简单的语言，逐步介绍大语言模型的架构，并且展示这些架构是如何随着时间演变的。

运维小子·2025-02-23 08:44

使用 ChatGPT 构建 YouTube 下载器的分步指南

只需按照本教程中的步骤操作......ChatGPT是OpenAI训练的大型语言模型，可以根据自然语言输入生成代码。

pxr007·2025-02-23 07:37

科普：大模型使用中的temperature 与 top-k及其它

在大语言模型（如通过Ollama运行的llama2模型）中，temperature和top-k是两个用于控制文本生成过程的重要参数，它们在功能上相互独立，但又共同影响着模型生成文本的随机性和多样性。

人工干智能·2025-02-22 23:35

DeepSeek新作-Native Sparse Attention

NSA概述长文本建模的重要性与挑战长文本建模的重要性：长文本建模对于下一代语言模型至关重要。

数据分析能量站·2025-02-22 21:21

Github 2024-04-29 开源项目周报 Top15

根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目11TypeScript项目3Go项目1Svelte项目1JupyterNotebook项目1Swift项目1Ollama:本地大型语言模型设置与运行创建周期

老孙正经胡说·2025-02-22 21:15

用示例提升大语言模型的查询分析能力！

引言随着查询分析的复杂性增加，大语言模型（LLM）在理解如何响应某些场景时可能会面临挑战。为了提高性能，我们可以在提示中添加示例，以便更好地引导模型。

llzwxh888·2025-02-22 19:31

如何创建自定义Retriever来增强LLM应用程序

引言在许多大语言模型（LLM）应用中，我们需要从外部数据源中检索信息，以便生成更准确和相关的响应。这些信息往往通过Retriever模块检索，然后用于生成提示，供LLM进行处理和响应。

llzwxh888·2025-02-22 19:00

第十节：通过Debug解析ChatGLMModel的数据流，理解视觉与语言模型结合架构

文章目录前言一、forward的参数解读二、图像编码token数量值方法解读三、input_ids的embedding方法解读1、embedding编码方法2、Embedding源码四、视觉编码方法解读五、inputs_embeds与position_ids编码加工方法解读1、inputs_embeds与position_ids编码方法2、图示解读编码方法3、inputs_embeds与posit

tangjunjun-owen·2025-02-22 17:43

LLM之提示词工程

1.提示与提示工程提示工程作为一门新兴的学科，专注于开发和优化提示技术，旨在提升语言模型（LMs）在各种应用与研究主题中的效能。

樱花的浪漫·2025-02-22 16:11

LLaVA-CoT: Let Vision Language Models Reason Step-by-Step

LLaVACoT：让视觉语言模型逐步推理摘要1引言2相关工作3提出的方法4后训练性能5推理时间缩放6最新VLMs的比较7结论摘要大型语言模型在推理能力方面取得了长足的进步，特别是通过推理时间缩放，如OpenAI

UnknownBody·2025-02-22 16:08

用 Python + LLM 实现一个智能对话

大型语言模型LLM最近比较火，所以我也来用LLM写个智能对话玩玩。简介大语言模型LLM全称是LargeLanguageModels。LLM是指具有巨大参数量和极高语言理解能力的神经网络模型。

AGI大模型学习·2025-02-22 15:04

大语言模型基础

AI大模型主要分为三类：大语言模型、CV大模型和多模态大模型，我将分别介绍它们的背景知识、关键技术、演进路线和挑战。什么是大语言模型大语言模型（LargeLanguageModel，LL

MatrixSparse·2025-02-22 15:27

无缝融入，即刻智能[4]：MaxKB知识库问答系统[进一步深度开发调试，完成基于API对话，基于ollama大模型本地部署等]

无缝融入，即刻智能[4]：MaxKB知识库问答系统[进一步深度开发调试，完成基于API对话，基于ollama大模型本地部署等]1.简介MaxKB(MaxKnowledgeBase)是一款基于LLM大语言模型的开源知识库问答系统

汀、人工智能·2025-02-22 13:14

2023-arXiv-FinGPT: 开源金融大语言模型

|https://github.com/AI4Finance-Foundation/FinGPT&https://github.com/AI4Finance-Foundation/FinNLP摘要：大语言模型

量仔搞靓化·2025-02-22 12:41

基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写

AAIshangyanxiu·2025-02-22 10:26

【有啥问啥】DeepSeek NSA（Native Sparse Attention）：开启高效推理与降本增效的新篇章

DeepSeekNSA（NativeSparseAttention）：开启高效推理与降本增效的新篇章在人工智能领域，尤其是自然语言处理（NLP）和大语言模型（LLM）的浪潮中，性能与效率一直是研究者和开发者关注的焦点

有啥问啥·2025-02-22 09:46

推理模型时代：大语言模型如何从对话走向深度思考？

一、对话模型和推理模型的区别概述对话模型是专门用于问答交互的语言模型，符合人类的聊天方式，返回的内容可能仅仅只是一个简短的答案，一般模型名称后面会带有「chat」字样。

深度学习机器·2025-02-22 07:56

哪种LLM量化方法最适合您？：GGUF、GPTQ 还是 AWQ

它是一种专为大型语言模型设计的量化方法。它允许用户在CPU上运行LLM，同时通过提供速度改进将一些层卸载到GPU。GGUF对于那些在CPU或Apple设备上运行模型的用户特别有用。在GGUF上

GordonJK·2025-02-22 05:38

大模型应用开发的框架

一、大语言模型的几个框架1、python的版本langchainLangChain英文官方地址：https://www.langchain.com/LangChain中文官网：https://www.langchain.com.cn

红豆和绿豆·2025-02-22 00:23

告别 AI 幻觉：LangChain + 知识图谱 + 大模型，打造可靠的智能应用

总结与展望后记1.前言：知识图谱在AI中的地位在当今的人工智能领域，各类语言模型（如GPT系列、BERT等）已经深刻地影

海棠AI实验室·2025-02-22 00:20

有哪些好用的AI工具？(你想要的AI工具都在这)

https://chat.deepseek.com/豆包字节跳动开发的智能语言模型，基于深度学习技术，支持多种自然语言处理任务。

·2025-02-21 23:25

避坑指南：chatgpt账号购买成品号- chatgpt 4.0 plus成品号购买手册！

购买ChatGPT账号的注意事项及指南✨在当前人工智能技术快速发展的背景下，ChatGPT作为一种强大的语言模型工具️，受到了广泛关注。

·2025-02-21 23:25

AI 模型的优化与应用：大模型本体、蒸馏、量化与 GGUF

引言近年来，大型语言模型（LLM）在人工智能领域取得了突破性的进展，但其计算需求高昂，训练和推理成本巨大。因此，如何优化大模型，使其在不同设备和应用场景下更高效地运行，成为了AI研究的重要课题。

CCSBRIDGE·2025-02-21 23:15

有哪些好用的AI工具？(你想要的AI工具都在这)

https://chat.deepseek.com/豆包字节跳动开发的智能语言模型，基于深度学习技术，支持多种自然语言处理任务。

·2025-02-21 23:21

小型字符级语言模型的改进方向和策略

小型字符级语言模型的改进方向和策略一、回顾小型字符级语言模型的处理流程前文我们已经从零开始构建了一个小型字符级语言模型，那么如何改进和完善我们的模型呢？有哪些改进的方向？

搏博·2025-02-21 15:31

谷歌：缓存增强优化冻结LLM的推理性能

标题：DeliberationinLatentSpaceviaDifferentiableCacheAugmentation来源：arXiv,2412.17747摘要通过生成和处理中间推理步骤，使大型语言模型

大模型任我行·2025-02-21 14:22

【AI-32】浅显易懂地说一下LangChain

一句话理解LangChainLangChain是一个帮你快速搭建AI应用的工具箱，它把大型语言模型（如GPT）和外部数据、计算工具、业务流程连接起来，让开发AI应用像搭积木一样简单。

W Y·2025-02-21 06:55

使用BREEBS平台提升AI知识库

这些Breebs可供任何大语言模型（LLM）或聊天机器人使用，以提升其专业知识，减少幻觉，并提供访问来源的途径。Breebs背后实现了多种增强生成（RAG）模型，以在每次迭代中无缝提供有用的上下文。

dgay_hua·2025-02-21 05:11

langchain系列（二）- 提示词模板以及消息

Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250212说明：技术梳理提示词模板理论说明提示模板将用户输入和参数转换为语言模型的指令

码--到成功·2025-02-21 02:56

Ollama部署大模型，本地调用

Ollama简单介绍Ollama是一个强大的大型语言模型平台，它允许用户轻松地下载、安装和运行各种大型语言模型。

居7然·2025-02-21 01:53

Windows本地部署Ollama+qwen本地大语言模型Web交互界面并实现公网访问

要在Windows系统上部署Ollama和qwen本地大语言模型的Web交互界面，并实现公网访问，你需要按照以下步骤进行操作：安装Ollama：前往Ollama的GitHub仓库下载源代码或预编译的可执行文件

叨叨爱码字·2025-02-21 01:17

企业级RAG开源项目分享：Quivr、MaxKB、Dify、FastGPT、RagFlow

RAG技术能够有效地将大型语言模型（LLM）与企业私域知识库连接，在保证数据安全和模型可控性的前提下，释放LLM的强大能力。本文将深入探讨GitHub上五个备受瞩目的开源企业级RAG项目：Q

Ainnle·2025-02-21 00:16

ChatGPT和DeepSeek打造科研与办公的高效引擎

AAIshangyanxiu·2025-02-20 23:05

【大语言模型_3】ollama本地加载deepseek模型后回答混乱问题解决

背景：本地下载了DeepSeek-R1-Distill-Qwen-7B模型后，通过ollamacreateDeepSeek-R1-Distill-Qwen-7B-fds7b.mf加载模型启动后回答混乱，无法使用。解决方法重新下载模型，选择了DeepSeek-R1-Distill-Qwen-7B-Q4_K_M.gguf重新编写ds7b.mf文件，文件内容如下：FROM/root/zml/DeepSe

没枕头我咋睡觉·2025-02-20 21:54

国外7个最佳大语言模型 (LLM) API推荐

大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。

·2025-02-20 21:26

GPT (Generative Pre-trained Transformer)

GPT(GenerativePre-trainedTransformer)是由OpenAI提出的一个基于Transformer架构的自回归语言模型。

彬彬侠·2025-02-20 19:07

数学推理中在推理规模化下检查假阳性解

硅谷秋水·2025-02-20 17:18

AI 大模型：Intelligent Agent—— 开启智能新纪元

从软件工程的角度，智能体是一种基于大语言模型的，具备规划思考能力、记忆能力、使用工具函数的能力，能自主完成给定任务的计算机程序。

AI-入门·2025-02-20 16:36

Docker Compose部署大语言模型LLaMa3+可视化UI界面Open WebUI

一、介绍Ollama：部署+运行大语言模型的软件LLaMa3：史上最强开源AI大模型—Meta公司新发布的大语言模型OpenWebUI：AI用户界面，可通过浏览器访问二、Docker部署docker-compose.yml

m0_74824877·2025-02-20 14:44

DeepSeek原理介绍以及对网络安全行业的影响

大家好，我是AI拉呱，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，兼职硕士研究生导师；热爱机器学习和深度学习算法应用，深耕大语言模型微调、量化、私域部署。

AI拉呱·2025-02-20 13:08

大模型（含deepseek r1）本地部署利器ollama的API操作指南

ollama介绍：Ollama是一个开源的大型语言模型（LLM）平台，旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。

·2025-02-20 13:41

LLM的分布式部署：AI的云端革命

《LLM的分布式部署：AI的云端革命》关键词分布式部署语言模型云端计算资源管理性能优化安全性摘要本文将深入探讨大型语言模型（LLM）的分布式部署，分析其技术背景、架构设计、资源管理、性能优化以及安全性等方面

AI天才研究院·2025-02-20 12:01

DeepSeek与ChatGPT：AI语言模型的全面对决

DeepSeek（深度求索）与ChatGPT作为当前备受关注的两大AI语言模型，在技术架构、应用场景和性能表现上各有特色。

金枝玉叶9·2025-02-20 12:01

auto-gptq安装以及不适配软硬件环境可能出现的问题及解决方式

它的主要目标是通过量化技术（Quantization）将大型语言模型（LLM）等深度学习模型的大小和计算复

IT修炼家·2025-02-20 12:00

LLM与知识图谱融合:智能运维知识库构建

其中，大语言模型（LLM）和知识图谱是两个重要的技术方向。LLM能够理解和生成自然语言，可以用于构建智能

AI天才研究院·2025-02-20 11:45

使用Yuan 2.0与LangChain构建智能聊天应用：完整指南

技术背景介绍Yuan2.0是IEIT系统开发的新一代基础大语言模型，包括Yuan2.0-102B、Yuan2.0-51B和Yuan2.0-2B三种版本。

scaFHIO·2025-02-20 05:33

Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention

不让任何上下文掉队：无限关注的高效无限上下文Transformer摘要1引言2方法3实验4相关工作5结论摘要这项工作介绍了一种将基于Transformer的大型语言模型（LLM）扩展到具有有限内存和计算的无限

UnknownBody·2025-02-20 05:00

KTransformers如何通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度？

KTransformers通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度，具体体现在以下几个方面：内核级优化：KTransformers采用了高效的内核级优化技术，包括对

魔王阿卡纳兹·2025-02-20 04:53

推荐频道

闻达语言模型

人工智能：从基础到前沿

Grok-3：人工智能领域的新突破

大语言模型架构：从基础到进阶，如何理解和演变

使用 ChatGPT 构建 YouTube 下载器的分步指南

科普：大模型使用中的temperature 与 top-k及其它

DeepSeek新作-Native Sparse Attention

Github 2024-04-29 开源项目周报 Top15

用示例提升大语言模型的查询分析能力！

如何创建自定义Retriever来增强LLM应用程序

第十节：通过Debug解析ChatGLMModel的数据流，理解视觉与语言模型结合架构

LLM之提示词工程

LLaVA-CoT: Let Vision Language Models Reason Step-by-Step

用 Python + LLM 实现一个智能对话

大语言模型基础

无缝融入，即刻智能[4]：MaxKB知识库问答系统[进一步深度开发调试，完成基于API对话，基于ollama大模型本地部署等]

2023-arXiv-FinGPT: 开源金融大语言模型

基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写

【有啥问啥】DeepSeek NSA（Native Sparse Attention）：开启高效推理与降本增效的新篇章

推理模型时代：大语言模型如何从对话走向深度思考？

哪种LLM量化方法最适合您？：GGUF、GPTQ 还是 AWQ

大模型应用开发的框架

告别 AI 幻觉：LangChain + 知识图谱 + 大模型，打造可靠的智能应用

有哪些好用的AI工具？(你想要的AI工具都在这)

避坑指南：chatgpt账号购买成品号- chatgpt 4.0 plus成品号购买手册！

AI 模型的优化与应用：大模型本体、蒸馏、量化 与 GGUF

有哪些好用的AI工具？(你想要的AI工具都在这)

小型字符级语言模型的改进方向和策略

谷歌：缓存增强优化冻结LLM的推理性能

【AI-32】浅显易懂地说一下LangChain

使用BREEBS平台提升AI知识库

langchain系列（二）- 提示词模板以及消息

Ollama部署大模型，本地调用

Windows本地部署Ollama+qwen本地大语言模型Web交互界面并实现公网访问

企业级RAG开源项目分享：Quivr、MaxKB、Dify、FastGPT、RagFlow

ChatGPT和DeepSeek打造科研与办公的高效引擎

【大语言模型_3】ollama本地加载deepseek模型后回答混乱问题解决

国外7个最佳大语言模型 (LLM) API推荐

GPT (Generative Pre-trained Transformer)

数学推理中在推理规模化下检查假阳性解

AI 大模型：Intelligent Agent—— 开启智能新纪元

Docker Compose部署大语言模型LLaMa3+可视化UI界面Open WebUI

DeepSeek原理介绍以及对网络安全行业的影响

大模型（含deepseek r1）本地部署利器ollama的API操作指南

LLM的分布式部署：AI的云端革命

DeepSeek与ChatGPT：AI语言模型的全面对决

auto-gptq安装以及不适配软硬件环境可能出现的问题及解决方式

LLM与知识图谱融合:智能运维知识库构建

使用Yuan 2.0与LangChain构建智能聊天应用：完整指南

Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention

KTransformers如何通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度？

AI 模型的优化与应用：大模型本体、蒸馏、量化与 GGUF