N-gram语言模型。第16页

深入解析：如何使用 Ollama 下载与使用本地大语言模型

在当今数字化时代，大语言模型（LLM）的应用越来越广泛，从自然语言处理到文本生成，从代码辅助到智能问答，它们都展现出了强大的能力。然而，使用云端大语言模型往往面临着成本高昂、隐私泄露等问题。

大懒猫软件·2025-02-11 16:22

AI代码生成器安全隐患：Grok泄露系统提示词事件警示

最近，一个名为Grok的大型语言模型泄露了其系统提示词，引发了业内对AI写代码工具安全性和透明度问题的广泛关注。

·2025-02-11 15:22

以创新测评赋能未来：CSDN开源与智能技术创新研究院发布大模型综合榜单

随着人工智能的持续演进，大语言模型在越来越多的领域中发挥着关键作用。对中小企业或个人用户而言，如何选择适合自身需求、具有高性价比且能够快速落地的大语言模型，成为技术应用的核心关切。

CSDN资讯·2025-02-11 15:17

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

及依赖库模型下载安装HuggingFaceCLI下载DeepSeek-R1-Distill-Qwen-32B模型启动启动命令启动确认模型验证发送API请求示例输出注意事项参考链接前言VLLM是一个高效且轻量的大规模语言模型

engchina·2025-02-11 14:41

动手学大语言模型LLM-02

文章目录LLMAPI开发基础知识PromptTemperaturesystemprompt使用LLMAPIpromptengineeringprompt设计原则1、编写清晰、具体指令1、使用分隔符清晰表示不同的输入部分2、寻求结构化的输出3、要求模型检查是否满足条件4、提供少量的示例2、让模型有时间去思考1、指定完成任务的步骤2、指导模型在下结论之前找到自己的解法LLMAPI开发基础知识Promp

阿苏拉则_妫·2025-02-11 12:28

DeepSeek R1 简易指南：架构、本地部署和硬件要求

DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。该研究突破性地采用强化学习（Reinfo

·2025-02-11 12:49

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

01什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机，是接受客户输入prompt和生成返回response的枢纽，也是拉起异构硬件，将物理电能转换为人类知识的变形金刚。

·2025-02-11 11:44

云上一键部署 DeepSeek-V3 模型，阿里云PAI Model Gallery 最佳实践

DeepSeek-V3模型简介DeepSeek-V3是DeepSeek发布的MoE（Mixture-of-Experts）大语言模型，总参数量为6710亿，每个token激活的参数量为370亿。

·2025-02-11 11:44

DeepSeek与ChatGPT对比：技术、应用与未来趋势

在人工智能飞速发展的时代，大语言模型成为了推动技术革新和产业变革的核心力量。DeepSeek和ChatGPT作为其中的典型代表，各自凭借独特的技术架构、训练方式和应用优势，在不同领域展现出卓越的性能。

CodeJourney.·2025-02-11 11:49

如何在 VSCode 中使用通义灵码（Tongyi Lingma）智能编程助手

与GitHubCopilot类似，通义灵码基于大语言模型（LLM），可以提供代码补全、智能纠错、代码生成等功能，极大提升开发效率。本文将详细介绍如何在VSCode中安装和使用通义灵码，

全栈探索者chen·2025-02-11 06:09

《大语言模型：原理与工程实践》书籍推荐及详细说明

随着人工智能技术的发展，尤其是深度学习技术的进步，大规模语言模型（LargeLanguageModels,LLMs）已成为自然语言处理领域的研究热点。

大模型入门教程·2025-02-11 01:57

大模型入门（六）—— RLHF微调大模型

一、RLHF微调三阶段参考：https://huggingface.co/blog/rlhf1）使用监督数据微调语言模型，和fine-tuning一致。

LLM.·2025-02-10 23:17

SEO友好架构提升LLM应用的可发现性

《SEO友好架构提升LLM应用的可发现性》文章关键词SEO友好架构语言模型（LLM）搜索引擎优化（SEO）可发现性内容优化技术优化用户体验优化信息组织关键词策略社交媒体推广摘要本文旨在探讨如何通过SEO

AI天才研究院·2025-02-10 17:00

【AI论文】LIMO：推理中少即是多

摘要：我们提出了一项重大发现，这一发现挑战了我们对大型语言模型中复杂推理能力涌现方式的理解。传统观点认为，复杂的推理任务需要大量的训练数据（超过10万例）。

东临碣石82·2025-02-10 16:55

2025最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用

随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。

梦想的初衷~·2025-02-10 16:53

荣耀已接入DeepSeek-R1，荣耀手机系统版本MagicOS8.0及以上用户可用

以下是关于这一事件的详细介绍：DeepSeek-R1的强大能力DeepSeek-R1是一款先进的语言模型，具备强大的自然语言处理能力、逻辑推理能力和上下文理解能

2501_90444774·2025-02-10 14:10

《具身智能时代：机器人具身抓取技术的前沿探索与应用综述》

自2022年GPT等大模型的爆发以来，人工智能领域以语言模型为代表的预训练模型在多个领域掀起了创新浪潮。

笑傲江湖2023·2025-02-10 13:53

ChatGPT vs. DeepSeek：大模型赛道的差异化竞争

ChatGPTvs.DeepSeek：大模型赛道的差异化竞争人工智能语言模型的快速发展正在重塑人机交互的边界，在这场技术浪潮中，ChatGPT与DeepSeek作为两类典型代表，展现出截然不同的技术路线与市场定位

TKang8912·2025-02-10 12:49

谈大语言模型动态思维流编排

尽管大语言模型已经呈现出了强大的威力，但是如何让它完美地完成一个大的问题，仍然是一个巨大的挑战。需要精心地给予大模型许多的提示（Prompt）。

姚家湾·2025-02-10 10:31

代码星辰：探索 benchmark 构建的奥秘之旅

而在这片“代码星海”中，如何评估大语言模型（LLMs）在编程任务上的表现，就像天文学家借助望远镜探索宇宙奥秘一般关键。近日，一篇题为《HowShouldIBuildABenchmark?

步子哥·2025-02-10 07:56

AI系列：大语言模型的function calling（下）- 使用LangChain

装饰器其他方式:Pydantic2.绑定tools/functions3.调用大模型(LLM)4.functioncalling处理流程LangChain版代码与原生LLM调用的比较参考前言在AI系列：大语言模型的

liyane·2025-02-10 05:38

AI大模型系列之七：Transformer架构讲解

前馈神经网络编码器（Encoder）解码器（Decoder）：基于卷积神经网络（CNN）的编码器-解码器结构基于Transformer架构的主流语言模型有哪

m0_74823683·2025-02-10 03:58

大模型学习笔记 - LLM 对齐优化算法 DPO

LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预训练是从大量语料中进行无监督学习，语料库内容混杂，训练的目标是语言模型损失，任务是nexttokenprediction

JL_Jessie·2025-02-10 03:54

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域，大型语言模型（LLMs）的应用越来越广泛。

qq_37836323·2025-02-10 01:37

为什么要学习AI/机器学习

考虑到当前技术发展趋势和未来潜力，我建议重点学习AI/机器学习相关技术，特别是大语言模型(LLM)相关的技术栈。原因如下：1.为什么选择AI/LLM？

数字沉思·2025-02-09 21:09

解锁DeepSeek大模Q型：超实用提示词技巧大放送

DeepSeek大模型简介DeepSeek是由深度求索(DeepSeekInc.)团队开发的大型预训练语言模型，以其高效推理、多模态融合及对垂直领域的深度优化而著称。

计算机学长·2025-02-09 20:04

重拾二进制之魂：大语言模型与逆向工程的奇幻旅程

逆向工程，这门解构编译产物、还原软件真貌的神秘艺术，正迎来了一场革命性的变革——由大语言模型赋能的LLM4Decompile系统。

步子哥·2025-02-09 18:50

动态词表采样：一种控制模型词表大小的新方法

背景介绍随着深度学习技术的发展，尤其是Transformer架构的成功应用，预训练语言模型如BERT、GPT等取得了

东方佑·2025-02-09 18:50

从零开始构建一个大语言模型-第六章第一节

第六章目录6.1不同类型的微调6.2准备数据集6.3创建数据加载器6.4用预训练权重初始化模型6.5添加分类头6.6计算分类损失和准确率6.7在有监督数据上微调模型6.8将大语言模型用作垃圾邮件分类器本章内容涵盖介绍不同的大语言模型微调方法为文本分类准备数据集修改预训练大语言模型以进行微调使用微调后的大语言模型对新数据进行分类到目前为止

释迦呼呼·2025-02-09 18:17

DeLLMa框架：优化复杂决策的新路径

标题：DeLLMa框架：优化复杂决策的新路径文章信息摘要：DeLLMa框架通过整合大型语言模型（LLMs）和结构化数据，优化了在不确定性条件下的决策过程，特别是在处理复杂决策问题时，能够增强决策的严谨性和精确性

XianxinMao·2025-02-09 16:07

Python如何使用Ollama库

这个库使得Python开发者能够轻松地在他们的项目中集成和运行大型语言模型。主要功能模型管理：通过Python脚本管理模型的创建、拉取、删除和复制。

阿雄不会写代码·2025-02-09 15:32

如何使用Ollama部署大模型

正文Ollama简介Ollama是一个专为在本地环境中运行和定制大型语言模型而设计的工具。

阿雄不会写代码·2025-02-09 14:57

llama.cpp的C语言API使用

我们知道，一般运行大语言模型都是在Python上运行的，可是Python的性能太差了，不适合用于生产环境，因此可以采用llama.cpp提供的API在C语言上运行大模型。

怎么这么多名字都被占了·2025-02-09 13:43

Ollama详解教程

Ollama是一个用于管理和运行大型语言模型的工具，通常需要根据具体的使用场景进行配置。以下是一个典型的Ollama配置说明，涵盖了安装、模型管理、API使用以及常见配置选项。

换个网名有点难·2025-02-09 12:12

服务网格（Service Mesh）在LLM应用架构中的应用

文章关键词服务网格、LLM应用架构、微服务通信、控制平面、数据平面、性能优化、安全性摘要本文深入探讨了服务网格在大型语言模型（LLM）应用架构中的关键作用。

AI天才研究院·2025-02-09 11:32

蒸馏：让DeepSeek用“移魂大法”增强你的小模型

蒸馏：让DeepSeek用“移魂大法”增强你的小模型原创格知致能寒武纪人工智能2025年02月06日00:48北京前言在大型语言模型（LLMs）时代，知识蒸馏成为一种重要方法，用于将能力强大的、参数规模庞大的

AI生成曾小健·2025-02-09 11:58

超简单的Ollama集成 DeepSeek 本地化安装教程

Ollama是一个基于Go语言的本地大语言模型运行框架，可以集成如DeepSeek等AI大模型。

diygwcom·2025-02-09 10:25

DeepSeek-V3 技术报告（核心技术，接近5万字）

摘要我们介绍了一个强大的混合专家（MoE）语言模型DeepSeek-V3，它具有总计671亿个参数和每个令牌激活的37亿个。

zhangjiaofa·2025-02-09 10:21

14.4K+ Star！GPT Researcher：一个基于AI的智能研究助手

GPTResearcher简介GPTResearcher[1]是一个基于大型语言模型（LLM）的自动化智能体，目标是对任何给定主题进行在线全面研究。

鱼满满记·2025-02-09 07:00

MaxKB开源知识库问答系统累计下载数量超过300,000次！

截至2024年12月30日22:00，飞致云旗下开源项目——基于大语言模型和RAG的知识库问答系统MaxKB全网累计下载数量超过300,000次！

FIT2CLOUD飞致云·2025-02-09 04:03

【实用技巧篇】DeepSeek 常用提示词大揭秘，一文带你全掌握

之前咱聊了用DeepSeek和Kimi自动做PPT，今天就来深入挖掘一下DeepSeek这个大语言模型的“秘密武器”——常用提示词。

再见孙悟空_·2025-02-09 01:13

一文搞懂DeepSeek - 开源模型R1

DeepSeek-R1作为一款开源的大型语言模型，在数学、编程和推理等多个任务上表现出了强大的性能。

程序员辣条·2025-02-09 01:12

DeepSeek模型全解析：赋能人工智能新纪元

以下是对DeepSeek模型的详尽剖析：一、模型概览DeepSeek，源自一家中国AI初创公司，其最新版本DeepSeek-V3是一款基于先进的Mixture-of-Experts（MoE）架构的语言模型

云梦优选·2025-02-08 23:01

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

这是深入了解大型语言模型LLMs如何训练的绝佳机会。

大模型之路·2025-02-08 20:03

速看！openKylin本地部署并运行DeepSeek-R1全攻略！

这款语言模型，一经发布直接在全球范围内爆火，成为顶流，在热搜上更是牢牢占据一席之地。无论是技术大神，还是紧跟潮流的技术小白，都被它强大的自然语言处理能力狠狠吸引，谁不想赶紧上手体验一把呢？

·2025-02-08 19:31

知识库升级新思路：用生成式AI打造智能知识助手

生成式AI，特别是像ChatGPT这样的语言模型，为知识库管理系统带来了新的可能性。一、知识库管理系统的现

·2025-02-08 19:01

速看！openKylin本地部署并运行DeepSeek-R1全攻略！

这款语言模型，一经发布直接在全球范围内爆火，成为顶流，在热搜上更是牢牢占据一席之地。无论是技术大神，还是紧跟潮流的技术小白，都被它强大的自然语言处理能力狠狠吸引，谁不想赶紧上手体验一把呢？

·2025-02-08 18:52

熬夜整理模型下载、量化、代码调用可免费使用离线部署的上千个国内外开源大模型梳理，整理开源的大语言模型，以规模较小、可私有化部署、训练成本较低的模型为主，包括底座模型，垂直领域微调及应用，数据集与教程等

熬夜整理模型下载、量化、代码调用，可免费使用离线部署的上千个国内外开源大模型梳理，整理开源的大语言模型，以规模较小、可私有化部署、训练成本较低的模型为主，包括底座模型，垂直领域微调及应用，数据集与教程等

代码讲故事·2025-02-08 15:32

【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

一、引言与背景在人工智能领域，大型语言模型（LLM）如DeepSeek以其卓越的自然语言理解和生成能力，推动了众多应用场景的发展。

后端研发Marion·2025-02-08 14:24

大语言模型应用指南：Gemini简介

1.背景介绍1.1大型语言模型的兴起近年来，随着计算能力的提升和数据量的爆炸式增长，大型语言模型（LLM）逐渐成为人工智能领域的研究热点。

AI天才研究院·2025-02-08 11:03

推荐频道

N-gram语言模型。

深入解析：如何使用 Ollama 下载与使用本地大语言模型

AI代码生成器安全隐患：Grok泄露系统提示词事件警示

以创新测评赋能未来：CSDN开源与智能技术创新研究院发布大模型综合榜单

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

动手学大语言模型LLM-02

DeepSeek R1 简易指南：架构、本地部署和硬件要求

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

云上一键部署 DeepSeek-V3 模型，阿里云PAI Model Gallery 最佳实践

DeepSeek与ChatGPT对比：技术、应用与未来趋势

如何在 VSCode 中使用通义灵码（Tongyi Lingma）智能编程助手

《大语言模型：原理与工程实践》书籍推荐及详细说明

大模型入门（六）—— RLHF微调大模型

SEO友好架构提升LLM应用的可发现性

【AI论文】LIMO：推理中少即是多

2025最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用

荣耀已接入DeepSeek-R1，荣耀手机系统版本MagicOS8.0及以上用户可用

《具身智能时代：机器人具身抓取技术的前沿探索与应用综述》

ChatGPT vs. DeepSeek：大模型赛道的差异化竞争

谈大语言模型动态思维流编排

代码星辰：探索 benchmark 构建的奥秘之旅

AI系列：大语言模型的function calling（下）- 使用LangChain

AI大模型系列之七：Transformer架构讲解

大模型学习笔记 - LLM 对齐优化算法 DPO

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

为什么要学习AI/机器学习

解锁DeepSeek大模Q型：超实用提示词技巧大放送

重拾二进制之魂：大语言模型与逆向工程的奇幻旅程

动态词表采样：一种控制模型词表大小的新方法

从零开始构建一个大语言模型-第六章第一节

DeLLMa框架：优化复杂决策的新路径

Python如何使用Ollama库

如何使用Ollama部署大模型

llama.cpp的C语言API使用

Ollama详解教程

服务网格（Service Mesh）在LLM应用架构中的应用

蒸馏：让DeepSeek用“移魂大法”增强你的小模型

超简单的Ollama集成 DeepSeek 本地化安装教程

DeepSeek-V3 技术报告 （核心技术，接近5万字）

14.4K+ Star！GPT Researcher：一个基于AI的智能研究助手

MaxKB开源知识库问答系统累计下载数量超过300,000次！

【实用技巧篇】DeepSeek 常用提示词大揭秘，一文带你全掌握

一文搞懂DeepSeek - 开源模型R1

DeepSeek模型全解析：赋能人工智能新纪元

Deepseek成功启示：从 TRPO 到 GRPO训练LLM

速看！openKylin本地部署并运行DeepSeek-R1全攻略！

知识库升级新思路：用生成式AI打造智能知识助手

速看！openKylin本地部署并运行DeepSeek-R1全攻略！

【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

大语言模型应用指南：Gemini简介

DeepSeek-V3 技术报告（核心技术，接近5万字）