N-gram语言模型。

️ 在 Windows WSL 上部署 Ollama 和大语言模型的完整指南20241206

️在WindowsWSL上部署Ollama和大语言模型的完整指南引言随着大语言模型（LLM）和人工智能的飞速发展，越来越多的开发者尝试在本地环境中部署大模型进行实验。

Narutolxy·2025-02-03 16:09

深度学习：基于MindNLP的RAG应用开发

RAG（Retrieval-AugmentedGeneration，检索增强生成）是一种结合检索（Retrieval）和生成（Generation）的技术，旨在提升大语言模型（LLM）生成内容的准确性、

Landy_Jay·2025-02-03 13:47

基于CNN(一维卷积Conv1D)+LSTM+Attention 实现股票多变量时间序列预测(PyTorch版)

运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域，讨论了各种复杂的深度神经网络思想，如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记忆、自然语言处理、深度强化学习、大型语言模型和迁移学习

矩阵猫咪·2025-02-03 12:42

大型语言模型（LLM）压缩技术：如何让庞然大物更轻巧？

大型语言模型（LLM）压缩技术：如何让庞然大物更轻巧？随着大模型在各个领域的广泛应用，我们面临的一个核心问题是——如何让这些庞大的模型在硬件资源有限的环境下运行？

空间机器人·2025-02-03 12:09

M-Ped: Multi-Prompt Ensemble Decoding for Large Language Models

M-Ped：大型语言模型的多提示集成解码摘要1引言2方法3实验4研究5相关工作6结论摘要随着大型语言模型（LLMs）在自然语言处理（NLP）领域的广泛应用，提高其性能已成为研究热点。

UnknownBody·2025-02-03 11:36

SlimGPT: Layer-wise Structured Pruning for Large Language Models

SlimGPT：大型语言模型的分层结构化修剪摘要1引言2相关工作3前言4方法5实验6结论摘要大型语言模型（LLM）因其在各个领域的卓越能力而受到广泛关注，其巨大的参数规模为实际部署带来了挑战。

UnknownBody·2025-02-03 11:35

AIGC的底层框架和技术模块

以下是对AIGC底层框架和技术模块的详细解析：底层框架AIGC的底层框架主要基于深度学习的语言模型，特别是Transformer模型及其变种，如GPT（GenerativePre-trainedTransformer

五岔路口·2025-02-03 07:27

什么是MOE架构？哪些大模型使用了MOE？

在人工智能快速发展的今天，大语言模型（LLM）的规模越来越大，参数量动辄上千亿甚至万亿。然而，更大的模型往往意味着更高的计算成本和更多的资源消耗。

明哲AI·2025-02-03 06:18

『大模型笔记』视觉语言模型解释

视觉语言模型解释文章目录一.视觉语言模型解析1.什么是视觉语言模型？

AI大模型前沿研究·2025-02-03 05:40

Github 2025-02-01 开源项目月报 Top20

8TypeScript项目3JupyterNotebook项目2Rust项目2HTML项目2C++项目1Ruby项目1JavaScript项目1Svelte项目1非开发语言项目1Go项目1Ollama:本地大型语言模型设置与运行创建周

老孙正经胡说·2025-02-03 03:30

VARGPT：将视觉理解与生成统一在一个模型中，北大推出支持混合模态输入与输出的多模态统一模型

微信公众号｜搜一搜：蚝油菜花快速阅读模型简介：VARGPT是北京大学推出的多模态大语言模型，专注于视觉理解和生成任务。主要功能：支持混合模态输入输出、高效视觉生成和广泛的多模态任务。

蚝油菜花·2025-02-03 02:18

DeepSeek-V2：强大、经济、高效的专家混合语言模型

DeepSeek-V2：强大、经济、高效的专家混合语言模型DeepSeek-V2项目地址:https://gitcode.com/gh_mirrors/de/DeepSeek-V2项目介绍DeepSeek-V2

乌芬维Maisie·2025-02-03 01:12

DeepSeek-R1,DeepSeek-V3,DeepSeek-VL,DeepSeek-V2,DeepSeek-R1-Zero各个模型区别

DeepSeek-V3：是混合专家（MoE）语言模型，采用Transformer架构。DeepSeek-VL：整体上是decoder-o

fpga和matlab·2025-02-03 01:12

NotebookLM：Google 最新 AI 笔记助理解析与实战应用

它结合了Google的大语言模型（LLM）能力，帮助用户更高效地整理、理解和生成知识内容。本文将全面解析NotebookLM的技术原理、核心功能、应用场景，并提供实际使用指南，帮助

赵大仁·2025-02-02 23:56

从零开始大模型开发与微调：汉字拼音数据集处理

随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModel，LLM）在NLP领域取得了显著的成果。

AGI大模型与大数据研究院·2025-02-02 22:43

AI大模型部署：Ollama与vLLM部署对比：哪个更合适？

前言近年来，大语言模型（LLM）的应用日益广泛，而高效的部署方案至关重要。Ollama和vLLM作为两种流行的LLM部署工具，各有优劣。

大模型部署·2025-02-02 21:11

OpenAI 实战进阶教程 - 第1节：OpenAI API 架构与基础调用

OpenAIAPI是一种工具，允许开发者通过编程方式与OpenAI的强大语言模型（例如gpt-3.5-turbo和gpt-4）进行交互。

山海青风·2025-02-02 21:37

根据每月流量和市场份额排名前20 的AI工具列表

ChatGPT：由OpenAI研发，是一款对话式大型语言模型。它能够理解自然语言输入，生成连贯且符合逻辑的回复。

开心的AI频道·2025-02-02 19:54

什么是LLM？看这一篇就够了！

本文主要介绍大语言模型（LargeLanguageModel，简称LLM）。

Python程序员罗宾·2025-02-02 14:50

【llm对话系统】大模型 Llama 源码分析之并行训练方案

1.引言训练大型语言模型(LLM)需要巨大的计算资源和内存。为了高效地训练这些模型，我们需要采用各种并行策略，将计算和数据分布到多个GPU或设备上。

kakaZhui·2025-02-02 13:14

【llm对话系统】大模型 Llama 源码分析之 Flash Attention

1.写在前面近年来，基于Transformer架构的大型语言模型(LLM)在自然语言处理(NLP)领域取得了巨大的成功。

kakaZhui·2025-02-02 13:43

使用Elasticsearch和SelfQueryRetriever实现智能电影检索

在这篇文章中，我们将结合Elasticsearch和SelfQueryRetriever，展示如何通过语言模型实现智能电影查询。

hgSdaegva·2025-02-02 13:43

使用 ChatPremAI 和 LangChain 构建高级聊天模型功能

##使用ChatPremAI和LangChain构建高级聊天模型功能###技术背景介绍随着生成式AI的快速发展，诸如ChatGPT等大型语言模型逐渐成为开发智能应用的核心组件。

hgSdaegva·2025-02-02 13:42

llama.cpp LLM_CHAT_TEMPLATE_DEEPSEEK_3

`LLM_CHAT_TEMPLATE_DEEPSEEK_3`References不宜吹捧中国大语言模型的同时，又去贬低美国大语言模型。水是人体的主要化学成分，约占体

Yongqiang Cheng·2025-02-02 12:10

【自然语言处理（NLP）】基于Transformer架构的预训练语言模型：BERT 训练之数据集处理、训练代码实现

文章目录介绍BERT训练之数据集处理BERT原理及模型代码实现数据集处理导包加载数据生成下一句预测任务的数据从段落中获取nsp数据生成遮蔽语言模型任务的数据从token中获取mlm数据将文本转换为预训练数据集创建

道友老李·2025-02-02 12:04

向量语义（Vector Semantics）与表征学习（Representation Learning）详解

传统的NLP方法（如基于规则的语言模型）需要人为定义单词的语义规则，而向量语义方法则通过分析单词在大量文本中的使用模式来学习其语义。

苏西月·2025-02-02 07:54

【llm对话系统】大模型 Llama、Qwen 和 ChatGLM 的网络结构和训练方法对比

1.引言近年来，大型语言模型(LLM)取得了令人瞩目的进展，其中Llama、Qwen和ChatGLM是三个备受关注的开源模型。

kakaZhui·2025-02-02 07:54

LLM的实时性：迈向毫秒级响应的AI

LargeLanguageModel(LLM),实时性,响应时间,微服务架构,并行处理,知识图谱,优化算法,延迟最小化1.背景介绍大型语言模型(LLM)在自然语言处理领域取得了令人瞩目的成就，展现出强大的文本生成

AI大模型应用之禅·2025-02-02 06:47

Aligner：自动修正AI的生成结果，北大推出残差修正模型对齐技术

微信公众号｜搜一搜：蚝油菜花快速阅读技术背景：Aligner是北京大学团队提出的大语言模型对齐技术，通过学习对齐答案与未对齐答案之间的修正残差来提升模型性能。

蚝油菜花·2025-02-02 01:22

大语言模型丨ChatGPT-4o深度科研应用、论文与项目撰写、数据分析、机器学习、深度学习及AI绘图（BP神经网络、支持向量机、决策树、随机森林、变量降维与特征选择、群优化算法等）

赵钰老师·2025-02-02 01:50

揭秘大语言模型：什么是LLM大模型？

前言自从去年chatgpt横空出世以来，它火爆也让大语言模型这个词变的很流行，到底什么是大语言模型，今天从初学者的角度介绍一下大语言模型的基本概念、组成部分和基本工作流程等。

AGI-杠哥·2025-02-01 23:11

【AI知识点】三种不同架构的大语言模型（LLMs）的区别

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】在自然语言处理（NLP）中，预训练语言模型（LLMs,LargeLanguageModels）通常基于不同的架构，如仅编码器的模型（Encoder-only

AI完全体·2025-02-01 23:09

大模型开发流程及架构

一、主要内容●以大语言模型为功能核心●利用大语言模型的强大理解能力和生成能力●结合特殊的数据或业务逻辑来提供独特功能的应用二、明确目标●大模型作为一个调用工具，不需要知道太多的原理，不需要优化模型能力●

寒夜灬星辰·2025-02-01 20:12

大模型开发流程及项目实战

一、大模型开发整理流程1.1、什么是大模型开发我们将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。

辣椒种子·2025-02-01 19:38

Meta首席科学家Yann LeCun预言：5年内AI架构将颠覆，当前大模型的4大核心缺陷

✨引言：一场颠覆AI行业的预言在2025冬季达沃斯“技术辩论”现场，Meta首席AI科学家、图灵奖得主杨立昆（YannLeCun）抛出一个震撼观点：“当前的大语言模型（LLM）范式将在3-5年内被淘汰。

机器小乙·2025-02-01 18:30

【AI人工智能】DeepSeek R1：你需要知道的一切

的所有你需要知道的一切内容，请坚持认真读完，必有收获：DeepSeekR1简要概述主要特点与能力开源与可访问性模型架构强化学习训练变体与精简模型使用案例与应用从专有模型迁移到开源模型1.DeepSeekR1简要概述大语言模型

大名顶顶·2025-02-01 17:22

深入探索Llama.cpp：在LangChain中使用llama-cpp-python

深入探索Llama.cpp：在LangChain中使用llama-cpp-python随着大语言模型（LLMs）的普及，开发者需要更有效的方法来部署和使用这些模型。

dfvcbipanjr·2025-02-01 16:10

DeepSeek R1 简易指南：架构、培训、本地部署和硬件要求

CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。

·2025-02-01 16:49

使用Ollama本地化部署DeepSeek

1、Ollama简介Ollama是一个开源的本地化大模型部署工具，旨在简化大型语言模型（LLM）的安装、运行和管理。

·2025-02-01 16:48

LLM-预训练：深入理解 Megatron-LM（2）原理介绍

最近在基于Megatron-LM的代码来训练大语言模型，本人觉得Megatron的代码很具有学习意义，于是大量参考了网上很多对Megatron代码的解读文章和NVIDAMegatron团队公开发布的2篇论文

u013250861·2025-02-01 15:05

如何在本地电脑上安装和使用 DeepSeek R-1

简介似乎每个人都在谈论DeepSeekR-1是中国人工智能公司DeepSeek开发的全新开源人工智能语言模型。一些用户声称，其推理能力与OpenAI的o1相当，甚至更好。

知识大胖·2025-02-01 15:33

玩转大语言模型——使用GraphRAG+Ollama本地构建知识图谱（完全本地化，不依赖OpenAI）

系列文章目录玩转大语言模型——使用langchain和Ollama本地部署大语言模型玩转大语言模型——ollama导入huggingface下载的模型玩转大语言模型——langchain调用ollama

艾醒(AiXing-w)·2025-02-01 15:31

深度解读大语言模型中的Transformer架构

一、Transformer的诞生背景传统的循环神经网络（RNN）和长短期记忆网络（LSTM）在处理自然语言时存在诸多局限性。RNN由于其递归的结构，在处理长序列时容易出现梯度消失和梯度爆炸的问题。这导致模型难以捕捉长距离的依赖关系，对于复杂的自然语言文本，无法有效地学习到上下文的关键信息。LSTM虽然在一定程度上缓解了梯度消失的问题，但依然存在梯度不稳定的情况。而且，RNN和LSTM在计算过程中，

老三不说话、·2025-02-01 05:16

LLM应用架构实战：基于LangChain的企业级最佳实践

前言随着ChatGPT等大语言模型的广泛应用，越来越多的企业开始将LLM整合到其业务系统中。然而，从概念验证(PoC)到生产环境的转换过程中，往往会遇到诸多技术挑战。

LLM教程·2025-02-01 05:44

构建高效LLM应用开发架构的关键策略

其中，大型语言模型（LLM）的应用开发尤为引人注目。LLM通过处理和理解自然语言，为各种场景提供了强大的智能解决方案，从智能客服到内容生成，再到教育应用，都有着广泛的应用前景。

AI天才研究院·2025-02-01 05:12

通过命令行工作流提升工作效率的实战教程（持续更新）

本文主要介绍了通过命令行工作流提升工作效率的实战教程，希望对使用大语言模型的同学们有所

herosunly·2025-02-01 05:37

表格化数据处理中大语言模型的微调优化策略研究

ResearchonFine-TuningOptimizationStrategiesforLargeLanguageModelsinTabularDataProcessing论文主要内容这篇论文的主要内容是研究大型语言模型

C7211BA·2025-01-31 23:25

使用大语言模型在表格化网络安全数据中进行高效异常检测

论文链接Efficientanomalydetectionintabularcybersecuritydatausinglargelanguagemodels论文主要内容这篇论文介绍了一种基于大语言模型

C7211BA·2025-01-31 23:54

探索未来AI：飞桨大模型套件PaddleFleetX引领技术新高度

探索未来AI：飞桨大模型套件PaddleFleetX引领技术新高度PaddleFleetX飞桨大模型开发套件，提供大语言模型、跨模态大模型、生物计算大模型等领域的全流程开发工具链。

窦育培·2025-01-31 22:14

DeepSeek-V3 技术报告

1概述本文介绍了DeepSeek-V3，一个强大的混合专家（MoE）语言模型，总参数量为6710亿，每个token激活的参数量为370亿。

mingo_敏·2025-01-31 20:01

推荐频道